Compute wird knapp, selbst Anthropic rationiert seine Modelle

Anthropic zieht Fable aus den Abos; GLM-5.2 läuft auf AMD zum halben Preis; Mistrals Leanstral findet echte Bugs

Juli 04, 2026

Compute wird knapp, selbst Anthropic rationiert seine Modelle

Rechenleistung wird zur härtesten Währung der KI-Branche: Anthropic entwickelt mit Samsung einen eigenen Chip, GLM-5.2 läuft auf AMD zum halben NVIDIA-Preis, und Anthropic zieht sein Fable-Modell aus den Abos, weil schlicht der Compute fehlt. Daneben liefert Mistrals Leanstral formale Beweise am Fließband und im Codex-Client tauchen erste Spuren von GPT-5.6 auf.

Anthropic zieht Fable aus den Abos, weil der Compute fehlt

Anthropic zieht Fable ab dem 7. Juli aus den Abos

Das für den breiten Einsatz gehärtete Modell der Mythos-Klasse verschwindet nach dem 7. Juli aus den Abo-Plänen. Der Grund ist nicht mangelndes Interesse, sondern das Gegenteil: Die Rechenkapazität reicht schlicht nicht, um die Nachfrage zu bedienen. Anthropic will Fable in die Abos zurückholen, sobald genug Compute frei wird. Das ist ein leises Eingeständnis, wie knapp Frontier-Rechenleistung inzwischen geworden ist. Nicht das Modell setzt die Grenze, sondern der Strom und das Silizium dahinter.

Quelle: Anthropic

Anthropic baut mit Samsung seinen eigenen KI-Chip

Anthropic baut seinen eigenen KI-Chip zusammen mit Samsung

Einem Bericht von The Information zufolge entwickelt Anthropic gemeinsam mit Samsung einen eigenen KI-Beschleuniger. Nur wenige Wochen zuvor hatte OpenAI mit Broadcom seinen ersten eigenen Chip angekündigt. Das Muster ist unübersehbar: Die Frontier-Labore lösen sich aus der Abhängigkeit von einem einzigen Zulieferer und ziehen die gesamte Kette ins eigene Haus, vom Modell bis zum Silizium. Wer die knappste Ressource der KI-Ära kontrolliert, die Rechenleistung, kontrolliert sein eigenes Tempo. Aus Softwarefirmen werden vertikal integrierte Hardware-Imperien.

GLM-5.2 läuft auf AMD zum halben Blackwell-Preis

GLM-5.2 läuft auf AMD zum halben Blackwell-Kostenpunkt

Die Nachfrage nach Inferenz wächst schneller, als NVIDIA Blackwell-Chips liefern kann. Genau in diese Lücke stößt jetzt AMD. GLM-5.2, eines der stärksten offenen Modelle, wurde auf AMDs MI355X mit 2.626 Token pro Sekunde und Knoten ausgeliefert, 213 Token pro Sekunde im Einzelstrom, bei über doppelt so niedrigen Kosten wie auf Blackwell. Damit fällt das Argument, dass Frontier-Inferenz zwingend über NVIDIA-Silizium laufen muss. Wenn Token bei fast gleicher Leistung nur die Hälfte kosten, verschiebt sich die Ökonomie generativer KI. Für jeden, der Modelle in Produkte einbaut, wird die Rechnung gerade neu geschrieben, nach unten.

Quelle: Wafer

Mistrals Leanstral löst PutnamBench und findet echte Bugs

Leanstral 1.5 schreibt und prüft formale Beweise, statt nur plausibel zu klingen. 119 Milliarden Parameter, davon nur 6 Milliarden aktiv, also erstaunlich schlank im Betrieb. Die Zahlen: 100 Prozent auf den miniF2F-Testsets, 587 von 672 gelösten PutnamBench-Aufgaben, dazu 87 Prozent in abstrakter Algebra. Spannender für die Praxis: Leanstral hat in 57 Open-Source-Repositories fünf bisher unbekannte Fehler aufgedeckt, indem es Code-Eigenschaften formal verifiziert hat. Beweisbarkeit wird zum Werkzeug gegen echte Bugs. Das Modell ist Apache-2.0-lizenziert und frei verfügbar.

Quelle: Mistral

GPT-5.6 zeichnet sich im Codex-Client ab

GPT-5.6 zeichnet sich im Codex-Code ab, Codenamen Sol, Terra und Luna

In der Codex-App tauchen bereits drei Modellvarianten auf, Sol, Terra und Luna, allesamt noch nicht freigeschaltet. Dazu Hinweise auf eine Echtzeit-Sprachsteuerung, die offenbar noch in Arbeit ist. Solche Spuren im ausgelieferten Client sind selten Zufall, sie markieren die letzte Etappe vor dem Launch. Bemerkenswert ist die Taktung: keine großen Sprünge auf eine mythische Versionsnummer, sondern dichte Iterationen im Halbjahresrhythmus. Wer glaubt, das Tempo lasse nach, verwechselt Marketingpausen mit Entwicklungsstillstand. Die Modelle kommen nicht seltener, sie werden nur leiser vorbereitet und dann umso härter ausgerollt.

KI meldet 1.500 kritische Sicherheitslücken in einem Monat

KI findet Sicherheitslücken schneller, als die Welt sie schließen kann

Die Zahlen von Epoch AI sind ein Signal: 21 namhafte Organisationen meldeten im Juni rund 1.500 schwere bis kritische Sicherheitslücken, über das 3,5-Fache des bisherigen Monatsrekords. Der Anstieg fällt zeitlich mit der Veröffentlichung von Claude Mythos Preview zusammen. KI-Modelle durchkämmen Codebasen inzwischen im industriellen Maßstab und legen Schwachstellen offen, die jahrelang unentdeckt blieben. Das ist zweischneidig: Dieselbe Fähigkeit, die Verteidiger absichern lässt, öffnet Angreifern ein neues Zeitfenster. Cybersicherheit wird zum Wettlauf zweier Maschinen.

Quelle: Epoch

Vellums KI-Assistenten sprechen sich in Slack selbst ab

Vellum hat Agent-zu-Agent-Kommunikation in Slack live geschaltet. Jeder Mitarbeiter bekommt einen eigenen Assistenten, der persönliche Historie, Präferenzen und Kontext trägt. Diese Assistenten zerlegen Aufgaben selbst, verhandeln Termine und holen Input vom Team ein. Berechtigungen bleiben standardmäßig isoliert, geteilt wird nur, was die Aufgabe wirklich braucht. Im Test planten zwei Agenten ein Offsite für 19 Personen an einem einzigen Tag. Der Arbeitsplatz bekommt eine zweite, autonome Belegschaft.

Grok Build startet ohne Setup in Railway-Sandboxes

Der terminale Coding-Agent von xAI, gebaut auf grok-build-0.1 mit 256.000 Token Kontext, ist ab sofort direkt in Railway-Sandboxes vorinstalliert. Kein lokales Setup, kein Rust-CLI, kein Installations-Overhead. Ein einziges ssh sandboxes@railway.new im Terminal genügt, und der Agent läuft in einer isolierten Linux-VM, führt Befehle aus, liest Output und iteriert selbstständig, ohne die eigene Maschine anzufassen. Damit reiht sich Grok Build neben Claude Code und OpenAI Codex ein, die Railway seit dem Sandbox-Start am 26. Juni bündelt. Coding-Agenten wandern von der lokalen Kommandozeile in wegwerfbare Cloud-Umgebungen.

Meta AI bekommt geplante Aufgaben und wird zum Prozess

Meta AI bekommt geplante Aufgaben im Web

Meta baut geplante Aufgaben für seinen Web-Assistenten. Meta AI soll künftig zeitgesteuert arbeiten, also Recherchen, Zusammenfassungen oder Erinnerungen automatisch zu festgelegten Zeitpunkten ausführen, ohne dass jemand den Chat öffnet. Damit schließt Meta die Lücke zu den Tasks-Funktionen von ChatGPT und Gemini. Der eigentliche Schritt steckt im Prinzip: Der Assistent hört auf, nur auf Zuruf zu antworten, und läuft im Hintergrund weiter. Genau hier verschiebt sich die Rolle vom Chatbot zum Agenten.

Anthropic bringt Claude mit 100.000-Dollar-Hackathon ins Labor

Anthropic öffnet Claude für die Laborbank

Anthropic macht mit der Wissenschaft ernst. Zusammen mit dem biomedizinischen Forschungsinstitut Gladstone startet vom 7. bis 13. Juli ein globaler, virtueller Hackathon namens Built with Claude: Life Sciences. Eine Woche lang bauen Teams weltweit mit Claude Science und Claude Code, der Preistopf umfasst 100.000 Dollar in API-Credits. Nach dem Start von Claude Science als Autopilot für die Forschung folgt jetzt der Praxistest an echten Life-Science-Problemen, von Genanalyse bis Wirkstoff-Screening. Anthropic positioniert Claude damit nicht als Chatbot, sondern als Werkzeug am Laborrand, dort wo Erkenntnis entsteht.

Quelle: Cerebralvalley

GitHub brennt öffentliche Repos auf CD-ROM

GitHub brennt dein öffentliches Repo auf CD-ROM

Zwei Tage nachdem Sony das Ende der physischen PlayStation-Disc verkündet hat, holt GitHub das Silberling-Zeitalter zurück. Wer will, bekommt sein öffentliches Repository auf eine echte CD gebrannt und per Post geliefert, limitiert auf die ersten 1.000, eine pro Person. Der Werbespruch: dein Code gehört dir physisch, für immer, bis du die CD verlierst. Ein eleganter Seitenhieb auf Sony, verpackt als Nostalgie-Gag. Millionen Entwickler, deren komplettes Lebenswerk plötzlich auf 700 Megabyte passt.

Quelle: Tomshardware

Chart des Tages: KI-native Startups bleiben schlank

Quelle: AI-Native-Firms-Studie (Kim, Koning)

Drei Jahre nach der Gründung beschäftigt ein KI-natives Startup im Schnitt gerade einmal rund 22 Menschen. Zum Start sind es 8, danach wächst das Team nur in kleinen Schritten. Der Grund: Was früher ganze Abteilungen gebunden hat, übernehmen heute KI-Systeme. Support, Vertrieb, Entwicklung und Content laufen mit einem Bruchteil der Belegschaft. So lässt sich Umsatz skalieren, ohne im gleichen Tempo Personal aufzubauen. Für Gründer und Mittelstand heißt das: Schlagkraft entsteht nicht mehr über die Kopfzahl, sondern über den klugen Einsatz von KI.

Tool-Empfehlung: VoicelyVoicely ist eine DSGVO-konforme Diktiersoftware mit KI-gestützter Spracherkennung, die in jeder App läuft. Wer viel schreibt, tippt damit nicht mehr, sondern spricht, und kommt nach eigenem Anspruch rund fünfmal schneller durch den Text. Ein nützlicher Eintrag im Werkzeugkasten für alle in der KI-Bubble, die ihren Schreiballtag tatsächlich beschleunigen statt nur über Produktivität reden wollen, mehr Infos: voicely.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?