Wochen-Echo: OpenAIs Preiskrieg, Anthropics Talent-Aderlass & Codex-Kollege

OpenAI startet Preiskrieg mit GPT-5.6; Anthropic zieht Google-Forscher ab; Gemini 3.5 Flash steuert den Rechner; Oracle streicht 21.000 Stellen

Juni 28, 2026

Wochen-Echo: OpenAIs Preiskrieg, Anthropics Talent-Aderlass & Codex-Kollege

Diese Woche eröffnet OpenAI mit der GPT-5.6-Familie den offenen Preiskrieg, während China den Token-Preis längst brutal unterbietet und Yann LeCun vor der Blase warnt. Parallel zieht Anthropic die nächsten Google-Spitzenforscher ab und verschiebt damit, wo die Frontier wirklich gebaut wird. Und der Agent rückt vom Chatfenster zum Kollegen: Codex, Gemini Flash und Claude Tag arbeiten quer durch ganze Abteilungen.

Claude Tag zieht in Slack ein und schreibt schon 65 Prozent des Codes

Anthropic schickt mit Claude Tag eine neue Entität direkt in den Slack-Channel: markieren, Aufgabe übergeben, fertige Pull Requests zurückbekommen. 65 Prozent des Codes im Anthropic-Produktteam stammen bereits aus der internen Version. Leonard Schmedding zeigt, wie sich daraus ein Company Brain bauen lässt, das nicht an einem einzelnen Anbieter hängt, sondern das eigene Wissen unabhängig hält. Dazu im Test: Seedance 2.5 aus China, das 30-Sekunden-Clips am Stück generiert, und Mistral OCR 4, das Dokumente in 170 Sprachen self-hosted erschließt. Drei Bausteine, an denen sich entscheidet, wie viel KI-Infrastruktur ein Unternehmen wirklich selbst kontrolliert.

Meta-Trends: OpenAIs Preiskrieg und Anthropics Talent-Aderlass

OpenAI startet Preiskrieg mit GPT-5.6 Sol, Terra und Luna

OpenAI greift Anthropic mit der GPT-5.6-Familie direkt am Preisschild an. Das größte Modell Sol kostet 5 Dollar Input und 30 Dollar Output pro Million Token und liegt damit näher an Claude Opus 4.8 (5 / 25) als am teuren Mythos 5 (10 / 50). Darunter sortieren sich Terra (2,50 / 15) mit der Leistung von GPT-5.5 zum halben Preis und Luna (1 / 6) als günstigster Einstieg ein. Der eigentliche Paukenschlag ist das Timing: Im Juli startet Sol auf Cerebras-Chips mit bis zu 750 Token pro Sekunde. Frontier-Intelligenz in dieser Geschwindigkeit verschiebt, was an Echtzeit-Agenten überhaupt machbar wird.

China unterbietet den Westen brutal beim Token-Preis

Dass dieser Preiskrieg überhaupt nötig wird, liegt an China. Ein direkter Vergleich der wichtigsten Modelle zeigt eine Lücke, die sich kaum noch schließen lässt: Chinesische Anbieter rufen für dieselbe Leistung einen Bruchteil dessen auf, was westliche Labs verlangen. Das ist kein Detail für Einkäufer, sondern eine strategische Verschiebung. Wer KI in großem Stil in Produkte und Prozesse gießt, rechnet in Tokens, und genau dort entscheidet sich, wer skalieren kann und wer an den Kosten erstickt. Für den Mittelstand heißt das: Die Frage ist längst nicht mehr ob KI, sondern zu welchem Preis.

Yann LeCun legt die unbequeme Rechnung dahinter offen: Die Preise für KI-Dienste steigen, die Betriebskosten sinken, aber längst nicht schnell genug. Die Anbieter schreiben rote Zahlen, einen großen Teil der Nutzung bezahlen am Ende die Investoren. Die Schlussfolgerung kippt jedoch schnell ins Falsche. Wer daraus liest, KI sei überschätzt, verwechselt eine Finanzierungsfrage mit einer Substanzfrage. Subventionierte Preise sind ein Manöver zur Markteroberung, kein Beleg gegen den Nutzen. Läuft die Förderung aus, verschwindet nicht die Technologie, sondern nur der Schleuderpreis.

Anthropic zieht weitere Google-Spitzenforscher ab

Während sich der Preiskampf zuspitzt, entscheidet sich die andere Front beim Personal. Jonas Adler und Alexander Pritzel, zwei der renommiertesten KI-Forscher bei Google, wechseln zu Anthropic. Sie reihen sich in eine Kette von Abgängen ein, die zuvor schon Schwergewichte wie Noam Shazeer und John Jumper Richtung Konkurrenz gehen ließ. Die eigentliche Nachricht steckt nicht im einzelnen Namen, sondern im Sog: Wer eine Frontier bauen will, braucht die paar hundert Köpfe, die wissen wie, und genau die laufen nicht zum Konzern mit dem größten Rechenzentrum, sondern dorthin, wo am dichtesten an der nächsten Modellgeneration gearbeitet wird. Kapital lässt sich beschaffen, dieses Wissen nicht.

Quelle: TechCrunch

KI-Tools: Mistral OCR 4 liest 170 Sprachen self-hosted

Mistral OCR 4: SOTA-Dokumentenmodell für 170 Sprachen

Der größte ungenutzte Datenschatz vieler Unternehmen liegt in PDFs, Scans und Formularen, also in Inhalten, die keine Maschine sauber lesen konnte. Mistral OCR 4 zielt genau dorthin: Das Modell erreicht SOTA-Niveau bei der Dokumentenerkennung, deckt 170 Sprachen ab und liefert nicht nur Text, sondern Bounding Boxes, also die exakte räumliche Verortung jedes Elements. Tabellen, Layouts und Strukturen bleiben erhalten, statt zu Buchstabensuppe zu zerfallen. Der entscheidende Hebel für den DACH-Mittelstand ist das Self-Hosted-Deployment: Akten, Verträge und Patientendaten müssen das eigene Rechenzentrum nicht verlassen. Damit fällt das größte Compliance-Argument gegen Dokumenten-KI weg.

Quelle: Mistral

Cursor zeigt ab sofort, welche Plugins, Skills und MCP-Server im eigenen Team am häufigsten genutzt werden, sortiert nach Popularität auf der neuen Customize-Seite. Jede Erweiterung lässt sich mit einem Klick ins eigene Setup übernehmen. Was bisher als verstreutes Wissen in einzelnen Configs schlummerte, wird damit zum geteilten Werkzeugkasten: Der produktivste Aufbau eines Kollegen ist kein Geheimwissen mehr, sondern eine Zeile im Ranking, die jeder sofort adoptiert. Für Teams bedeutet das weniger Reibung beim Onboarding und einen Standard, der sich organisch aus echter Nutzung formt statt aus Vorgaben von oben.

Google startet Study Notebooks in der Gemini App, einen interaktiven Lernraum, der aus einem Thema einen strukturierten Lernpfad baut, statt nur Antworten auszuspucken, ob Organische Chemie oder Prüfungsvorbereitung. Entscheidend ist die Reichweite: Study Notebooks sind kostenlos, ab sofort weltweit und in jeder Sprache verfügbar. Personalisiertes Lernen wandert damit vom teuren Nachhilfemarkt direkt in eine App, die Millionen ohnehin offen haben. Für Wissensarbeit heißt das: Die Einarbeitung in ein neues Feld wird zur Frage von Minuten, nicht von Kursgebühren.

KI-Agenten: Codex wird Kollege, Gemini Flash steuert den Rechner

OpenAI macht den Agenten zum Kollegen: Codex arbeitet quer durch jede Abteilung

Eine neue Economic-Research-Studie zeigt, wie OpenAI intern wirklich arbeitet: Codex übernimmt Aufgaben, die länger laufen, komplexer sind und über einzelne Teams hinausgreifen. Der Bruch ist grundlegend. Die Einheit der Wissensarbeit verschiebt sich vom kurzen Chat-Dialog zur delegierten Langstrecken-Aufgabe, die ein Agent minuten- bis stundenlang eigenständig abarbeitet, Werkzeuge orchestriert und sich iterativ zur Lösung vorarbeitet. Nicht mehr der Mensch bedient das Modell Frage für Frage, sondern übergibt ganze Arbeitspakete. Das ist die Vorschau darauf, wie Arbeit aussieht, sobald diese Werkzeuge breit verfügbar sind.

Quelle: OpenAI

Google macht das günstige Modell zum Agenten: Gemini 3.5 Flash steuert den Computer

Computer Use, also ein Modell, das eigenständig klickt, tippt, scrollt und durch Oberflächen navigiert, war bisher das teure Spitzenfeld der Frontier-Modelle. Google zieht die Fähigkeit jetzt in die Flash-Klasse, das schnelle, billige Arbeitstier des Hauses. Der entscheidende Hebel ist nicht das Können, sondern der Preis: Wenn ein Modell, das pro Aufgabe nur Centbruchteile kostet, ganze Klick-Workflows im Browser übernimmt, wird Web-Automatisierung vom Spezialprojekt zur Standardoperation. Genau die kleinteilige Sachbearbeitung, die Unternehmen bisher für zu fummelig zum Automatisieren hielten, rückt damit in wirtschaftliche Reichweite.

Quelle: Google

NVIDIA bündelt offene Nemotron-Modelle, Tools, Skills und eine abgesicherte Laufzeit zu einem modularen Toolkit, mit dem Firmen Agenten exakt auf ihre eigenen Workflows zuschneiden. Statt einen generischen Assistenten überzustülpen, baut man digitale Mitarbeiter für domänenspezifische Aufgaben, kontrollierbar und auf der eigenen Infrastruktur. Die abgesicherte Laufzeit adressiert genau den Punkt, an dem Agenten in der Praxis scheitern: Vertrauen und Kontrolle über das, was autonom passiert. Für den Mittelstand verschiebt sich die Frage damit vom Ob zum Wie, denn die Bausteine für eigene Agenten liegen jetzt offen und kombinierbar bereit.

KI-Arbeitsmarkt: Oracle streicht 21.000, Ex-Infosys-Chef greift an

Oracle streicht 21.000 Stellen und baut den Konzern zur KI-Maschine um

Innerhalb eines Jahres hat Oracle rund 21.000 Jobs weltweit abgebaut, während der Konzern hunderte Milliarden in KI-Infrastruktur pumpt. Der Schnitt ist kein Sparzwang aus Schwäche, sondern ein Umbau: Personal raus, Rechenleistung rein. Oracle positioniert sich als Cloud-Rückgrat der KI-Welle und richtet die eigene Kostenstruktur konsequent danach aus. Wer das nur als Entlassungswelle liest, übersieht die eigentliche Bewegung: Die Konzerne, die jetzt umschichten, formen sich gerade zur KI-Plattform. Gefährlich wird es für die, die abwarten und glauben, ihr klassisches Geschäftsmodell trage sie noch durch das Jahrzehnt.

Quelle: BBC

Der Ex-Infosys-Chef greift sein eigenes altes Geschäft an

Vishal Sikka hat einst Infosys geführt, einen Giganten des klassischen IT-Outsourcings, dessen Geschäftsmodell auf einer simplen Rechnung beruht: tausende Entwickler, günstig eingekauft, gegen Stundensatz verliehen. Genau dieses Modell nimmt er jetzt mit einem neuen KI-Startup ins Visier, finanziert von Mayfield und Aramco Ventures, besetzt mit Veteranen von SAP, Infosys und seiner eigenen KI-Firma Vianai. Die Wette ist eindeutig: Sobald Agenten den Großteil der Routine-Implementierung übernehmen, kollabiert die Logik vom Personalkörper als Produkt. Dass ausgerechnet ein Mann, der diese Maschine von innen kennt, sie zuerst angreift, sagt mehr über den Druck auf die Branche als jede Analystenprognose.

Quelle: TechCrunch

Ford ersetzte erfahrene Ingenieure durch KI-Systeme und ruderte zurück, weil die Qualität litt. Der Konzern räumt ein, der Erfahrung seiner fähigsten Ingenieure nicht genug Aufmerksamkeit geschenkt zu haben. Das klingt nach einem Beleg gegen den Hype, ist aber das Gegenteil. Ford hat nicht zu viel KI eingesetzt, sondern das wertvollste Asset weggeworfen, das eine KI überhaupt erst nützlich macht: das tiefe Domänenwissen der eigenen Leute. Wer Erfahrung entlässt, statt sie mit dem Modell zu koppeln, automatisiert keine Kompetenz, sondern Lücken. Die Lehre lautet nicht, KI könne es nicht, sondern: KI ersetzt nicht das Verstehen, sie verstärkt es.

Quelle: The Independent

Charts der Woche: Anthropic überholt OpenAI, Werbebudgets steigen

Anthropic überflügelt OpenAI an der Startup-Spitze

Die zwei wertvollsten privaten Unternehmen der Welt bauen beide KI-Modelle: Anthropic kommt auf 965 Milliarden Dollar, OpenAI auf 852 Milliarden. Dahinter klafft eine Lücke, Databricks (134) und Waymo (126) liegen weit zurück. Allein die beiden Spitzenreiter sind zusammen mehr wert als die nächsten fünf KI-Firmen addiert. Das private Kapital wettet derzeit fast ungeteilt auf die Frontier-Labore.

Anthropic fordert die meiste KI-Erfahrung

In den Stellenanzeigen der Labore klafft eine deutliche Lücke. Anthropic verlangt für technische Rollen im Schnitt 6,5 Jahre Berufserfahrung, OpenAI 5,9, DeepMind 4,7. Bei den chinesischen Laboren liegt die Latte tiefer: DeepSeek bei 3,1 Jahren, Alibaba Qwen bei 2,1, ByteDance Seed sogar nur bei 0,3. Während die US-Labore auf erfahrene Spezialisten setzen, rekrutieren chinesische Firmen breit und früh, oft direkt von den Universitäten.

KI verändert nicht nur, wie Kampagnen entstehen, sondern auch, wie viel Geld in sie fließt. 73 Prozent der befragten Marketer erwarten, dass ihr Werbebudget im nächsten Jahr durch KI steigt, bei einem Drittel sogar um 11 bis 20 Prozent oder mehr. Eine Gegenbewegung gibt es kaum: Nur 3 Prozent rechnen mit sinkenden Ausgaben. Im Marketing gilt KI nicht als Sparhebel, sondern als Wachstumstreiber.

Tool-Empfehlung: Voicely

Voicely ist eine DSGVO-konforme Diktiersoftware mit KI-gestützter Spracherkennung, die in jeder App läuft. Das Versprechen: fünfmal schneller schreiben, egal ob in der E-Mail, im Dokument oder im Chat. Für alle in der KI-Bubble, die Produktivität nicht nur diskutieren, sondern den eigenen Schreiballtag tatsächlich beschleunigen wollen, ein naheliegender Werkzeugkasten-Eintrag, mehr Infos: voicely.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?