Wochen-Echo: Codex-Super-App, Robo-Offensive & KI auf Pump

Codex wird zur Super-App; BYD steigt in Humanoide ein; KI-Ausbau läuft auf 151 Milliarden; Acemoglu warnt vor Knowledge Collapse

Juni 07, 2026

Wochen-Echo: Codex-Super-App, Robo-Offensive & KI auf Pump

Diese Woche kippt die KI von der Demo in die Bilanz. MiniMax stellt ein offenes Modell auf Frontier-Niveau bereit, Microsoft entwirft mit Project Solara ein Betriebssystem für Agenten, und in Washington wird offen über Staatsbeteiligungen an KI-Konzernen nachgedacht. Parallel rollen die ersten seriennahen Humanoiden an, während Ökonomen vor einem Knowledge Collapse warnen und der Infrastruktur-Ausbau zunehmend auf Pump läuft.

OpenAI verschmilzt ChatGPT und Codex zur App-Fabrik

Leonard Schmedding ordnet im Video der Woche ein, wie OpenAI Codex aus der Entwickler-Ecke holt und mit ChatGPT zu einer Super-App verschmilzt. Über die neue Funktion Sites werden Ideen und Arbeitsstände zu interaktiven Apps, die das ganze Team per URL öffnet, dazu kommen rollenspezifische Plugins und ein neues Memory-System, das ein fortlaufendes Bild des Nutzers baut. Der rote Faden: Aus dem Prompt wird die laufende Anwendung, und der Assistent wandert vom reinen Antwortgeber zum handelnden Akteur. Wer seine Arbeit auf ChatGPT stützt, sollte verstehen, was sich hier gerade von Grund auf verschiebt.

Meta-Trends: Offenes Frontier-Modell kontert, Microsoft baut Agenten-OS

MiniMax M3: Offenes Modell auf GPT-5.5-Niveau mit 1-Million-Kontext

Der chinesische Anbieter MiniMax stellt sein bislang stärkstes Modell unter offenen Gewichten bereit. Die Zahlen sortieren M3 in die Spitzengruppe: 59 Prozent auf SWE-Bench Pro, gleichauf mit GPT-5.5, dazu 66 Prozent auf Terminal Bench und ein Kontextfenster von einer Million Token, getragen von einer eigenen Sparse-Attention-Architektur. Spannend ist weniger der Benchmark als die Lizenz. Ein frei verfügbares Modell auf Frontier-Niveau bricht die Abhängigkeit von geschlossenen US-Anbietern und macht selbst gehostete Agenten mit Langzeitgedächtnis zur realistischen Option.

Auf der Build-Keynote stellt Microsoft Project Solara vor, eine Plattform, die nicht mehr um Apps und ein klassisches Betriebssystem herum gedacht ist, sondern um autonome Agenten. Die Logik: Wenn die KI Aufgaben selbst erledigt, braucht das Gerät keine App-Kacheln mehr, sondern eine Schicht, die Agenten ausführt, koordiniert und absichert. Die Hardware-Grundlage entsteht gemeinsam mit Qualcomm, also auf ARM-Silizium statt klassischer x86-Logik. Die Ansage dahinter: Die nächste Geräteklasse wird nicht mehr für den Menschen am Bildschirm optimiert, sondern für den Agenten im Hintergrund.

Donald Trump hat vor Reportern angedeutet, dass seine Regierung direkte US-Beteiligungen an KI-Unternehmen erwerben könnte, und will schon nächste Woche die Spitzen der Branche empfangen. Damit verschiebt sich die Logik des KI-Rennens: Washington begnügt sich nicht mehr mit Exportkontrollen und Subventionen, sondern denkt über eine Kapitalbeteiligung am Kern der Industrie nach. Wo der Staat Anteile hält, wird KI-Infrastruktur zur nationalen Vermögensfrage. Für europäische Entscheider heißt das, der wichtigste Markt verschmilzt zunehmend mit geopolitischer Strategie.

KI-Tools: Cursor designt per Geste, Gemma 4 läuft lokal

Mit dem neuen Design Mode wird die Oberfläche selbst zum Editor. Statt Komponenten im Code zu suchen, klickt man direkt auf ein Element, zeichnet die gewünschte Änderung ein oder beschreibt sie per Sprache, und der Agent setzt sie sauber im Code um. Die Grenze zwischen Mockup und fertiger App verschwindet: Was bisher ein Designer skizziert und ein Entwickler nachbaut, passiert in einem Schritt. Für Teams, die schnell Prototypen brauchen, schrumpft die Distanz zwischen Idee und lauffähigem Interface auf wenige Gesten.

Googles neues offenes Modell passt in 16 GB VRAM und läuft damit komplett auf einem normalen Laptop, ohne Cloud und ohne API-Rechnung. Agentisches Reasoning, Bildverständnis und Audio stecken in einem einzigen Modell, möglich macht das eine vereinheitlichte Architektur, die separate multimodale Encoder streicht. Die Leistung liegt nah an den deutlich größeren Gemma-Versionen, per Apache-2.0-Lizenz darf es jeder frei und kommerziell einsetzen. Die Reihe hat damit über 150 Millionen Downloads geknackt. Wer KI-Workloads aus Datenschutz- oder Kostengründen on-premise halten will, bekommt ein ernstzunehmendes Werkzeug.

Bisher war NotebookLM ein Lese- und Recherchewerkzeug. Jetzt taucht im Code eine Liste von über 40 Export-Formaten auf: PDF, DOCX, PPTX, CSV und EPUB für Dokumente, dazu MP3, WAV, MP4, PNG und WEBP für Audio, Bild und Video. Aus den eigenen Quellen entsteht damit direkt das fertige Deliverable, nicht nur eine Zusammenfassung im Chat. Die Veröffentlichung dürfte zusammen mit dem Sprung auf Gemini 3.5 Flash kommen. Für jeden, der Wissen aufbereitet und ausliefert, verschiebt sich die Grenze zwischen Recherche und Produktion in ein einziges Werkzeug.

KI-Agenten: Scout liest den Posteingang, ChatGPT verschickt Mails

Microsoft Scout: Always-On KI-Agent liest Mails und handelt eigenständig

Microsoft hat Scout vorgestellt, einen KI-Agenten, der permanent im Hintergrund läuft, E-Mails und Chats mitliest und auf dieser Basis eigenständig aktiv wird, ohne dass man ihn anstößt. Microsoft nennt das Prinzip Autopilot: Der Agent beobachtet den Posteingang den ganzen Tag und schlägt Aktionen vor oder führt sie aus, bevor der Nutzer selbst reagiert. Damit verschiebt sich die Rolle des Assistenten vom Werkzeug, das auf Befehl wartet, zum dauerhaft mitdenkenden Akteur. Für Unternehmen ist das eine doppelte Frage aus Produktivitätshebel und Governance, wenn eine KI ungefragt auf Kommunikation zugreift.

OpenAI verschiebt die Grenze zwischen Chatbot und Agent ein weiteres Stück. ChatGPT kann ab sofort E-Mails direkt aus der Konversation heraus senden, ohne Umweg über eine separate App oder Copy-Paste in den Mail-Client. Der Assistent formuliert, adressiert und verschickt, der Mensch bestätigt nur noch. Damit wird aus dem Sprachmodell ein handelnder Akteur im eigenen Postfach. Jede neue Aktion, die direkt ausgeführt statt nur vorgeschlagen wird, frisst sich weiter in den Alltag von Selbstständigen und Teams.

DeepMind stellt Co-Scientist vor, ein Multi-Agenten-System auf Gemini-Basis, das nicht nur Antworten liefert, sondern eigene Hypothesen erzeugt. Mehrere Agenten generieren Ideen, stellen sie gegeneinander zur Debatte und lassen sie über Runden hinweg evolvieren, bis am Ende neue, überprüfbare Vorschläge für komplexe wissenschaftliche Probleme stehen. Das Prinzip kopiert den wissenschaftlichen Diskurs in Software: These, Gegenrede, Verfeinerung. Statt eines einzelnen Modells, das rät, arbeitet hier ein Kollektiv aus spezialisierten Agenten auf einen Durchbruch hin.

Humanoide Roboter: BYD steigt ein, NVIDIA öffnet den Bauplan

Was mit Elektroautos begann, wird zur Blaupause für die nächste Maschinengeneration. BYD hat offiziell bestätigt, eigene humanoide Roboter zu entwickeln. Die Logik dahinter: Auto-KI und Roboter-KI teilen dieselbe Wurzel, und Chinas Fertigungsskala wird zum Hebel. Rund 60 Prozent der Hardware überlappt sich zwischen Fahrzeug und Roboter, der eigentliche Engpass liegt in den letzten 30 Prozent, der feinmotorischen Greifkunst und dem dynamischen Gleichgewicht. Der brisante Zusatz: BYD könnte die Roboter über sein bestehendes Händlernetz verkaufen, und 15 chinesische Autobauer setzen jetzt auf dieselbe Wette. Während deutsche Hersteller noch um Margen im Verbrenner ringen, verwandelt China die Autofabrik in eine Roboterfabrik.

Auf der GTC Taipei steht der erste offene Referenz-Bauplan für humanoide Roboter. Ein Chassis von Unitree, taktile Fünf-Finger-Hände mit Wave-Sensorik, im Kopf der Jetson-Thor-Rechner und die Isaac-GR00T-Plattform. Vom ersten Datensatz bis zum fertigen Modell liegt der komplette Stack offen. Wer bisher zwei Jahre und Millionen für eine eigene Hardware-Basis brauchte, startet jetzt auf einem fertigen Fundament. Robotik-Forschung wird damit zur Software-Frage.

Unitree zeigt mit dem GD01 die nach eigenen Angaben erste zivile Transformer-Maschine, die in Produktion gehen soll. Ein Pilot sitzt im Cockpit, die Maschine läuft auf zwei Beinen und klappt für mehr Stabilität in eine vierbeinige Haltung um. Der 500-Kilo-Mecha, in den man tatsächlich einsteigen kann, ist damit seriennah. Was bis gestern reine Anime-Fiktion war, rollt jetzt als reales Hardware-Produkt vom Reißbrett. Der Abstand zwischen Demo und Serienreife schrumpft bei chinesischen Robotik-Firmen auf Monate.

KI-Arbeitsmarkt: Rubio warnt vor der White-Collar-Welle, Acemoglu rechnet nach

Marco Rubio fordert Amerikaner auf, sich auf eine Zukunft vorzubereiten, in der künstliche Intelligenz innerhalb kurzer Zeit Millionen Arbeitsplätze ersetzt. Neu an seiner Warnung: Es trifft nicht nur die Fabrikhalle, sondern Millionen White-Collar-Profis, Sachbearbeiter, Analysten und Verwaltung. ‘There will be white-collar jobs that will be impacted’, sagt Rubio, und weiter: ‘That over time could destabilize societies all over the world.’ Wenn ein US-Außenminister offen von gesellschaftlicher Destabilisierung durch Automatisierung spricht, ist das Thema in der Realpolitik angekommen, nicht mehr im Tech-Feuilleton.

Acemoglu-NBER-Paper: Knowledge Collapse und nicht-monotone Wohlfahrt

MIT-Ökonom und Nobelpreisträger Daron Acemoglu modelliert in einem NBER-Paper die Langzeitwirkung generativer KI auf die menschliche Wissensproduktion. Sein Mechanismus: Wer ein schweres Problem löst, erzeugt zweierlei, die konkrete Antwort und das Prinzip dahinter. KI liefert die Antwort fertig, also sinkt der Anreiz, sich das Prinzip selbst zu erarbeiten. Acemoglu nennt das ein Knowledge-Collapse-Gleichgewicht: Ab einer bestimmten Genauigkeitsschwelle wird kaum noch verifiziert, exploriert, entdeckt. Die zentrale Pointe ist formal, die Wohlfahrt verläuft nicht-monoton zur KI-Genauigkeit. Ab einem Punkt kann steigende Genauigkeit die Gesellschaft schlechter stellen, weil die Fähigkeit zu neuem Grundlagenwissen erodiert.

Deutschland in 20 Jahren: 820.000 neue Staatsstellen, 800.000 Selbstständige weniger

Eine 20-Jahres-Kurve erzählt die Geschichte: plus 820.000 Stellen im öffentlichen Dienst, minus 800.000 Selbstständige. Die Verwaltung wächst, das Unternehmertum schrumpft. Wohlstand entsteht nicht im Aktenschrank, sondern durch Bauen, Erfinden, Kapitalbildung und freiwilligen Tausch. Wenn die klügsten Köpfe an Behördenschreibtische statt in Firmengründungen wandern, verzehrt eine Gesellschaft langsam ihr eigenes Saatgut. Deutschland leidet nicht an zu wenig Beamten, sondern an zu wenig Gründern, gerade in einer Zeit, in der KI die Hürde zur eigenen Firma so niedrig macht wie nie.

Charts der Woche: KI denkt mehr als sie tippt, Ausbau auf Pump

Im Job nutzen wir KI vor allem zum Denken

Quelle: Microsoft Work Trend Index, Microsoft-365-Copilot-Nutzungsdaten

49 Prozent der KI-Nutzung am Arbeitsplatz entfallen auf Analysieren, Abwägen und Entscheiden, fast die Hälfte. Das eigentliche Erstellen von Arbeit landet mit 19 Prozent abgeschlagen auf Platz zwei, dahinter die Interaktion mit anderen (17 Prozent) und das Sammeln von Informationen (15 Prozent). Der Wert steckt also in besseren Entscheidungen, nicht in mehr Output.

Quelle: Schroders Credit Lens

Die größten Cloud-Konzerne haben 2025 für rund 112 Milliarden Dollar Anleihen begeben, nach mageren 19 Milliarden 2024. 2026 sprengt jeden Rahmen: Schon bis Mitte Mai stehen 151 Milliarden Dollar zu Buche, mehr als im gesamten Vorjahr. Der Cashflow reicht für den Kapazitätshunger längst nicht mehr, die KI-Infrastruktur wird über den Kapitalmarkt vorfinanziert.

Washington D.C. führt die KI-Nutzung der USA an

Die Hauptstadtregion liegt mit 40,3 Prozent der arbeitenden Bevölkerung klar vorn, gefolgt von Maryland (38,3 Prozent) und Utah (35,7 Prozent), bei einem US-Durchschnitt von 31,3 Prozent. Die Kluft zeigt sich auch geografisch: In Metropolregionen nutzen 32,9 Prozent KI im Job, auf dem Land nur 16,2 Prozent. Wo Talent und Infrastruktur sitzen, wird KI doppelt so oft zum Arbeitswerkzeug.

Tool-Empfehlung: CorporateLLM

CorporateLLM ist eine DSGVO-konforme Unternehmens-KI-Plattform, die OpenRouter, Ollama oder jeden OpenAI-kompatiblen Provider in unter einer Minute anbindet und sicher mit dem eigenen Wissen chatten lässt, ab sofort im Free-Plan. Für alle in der KI-Bubble, die Modelle im eigenen Haus betreiben wollen, ohne dass Daten den Betrieb verlassen, ein naheliegender Werkzeugkasten-Eintrag, mehr Infos: corporatellm.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?