Sakanas Fugu erreicht die Frontier ohne Vendor-Lock-in

Sakana Fugu bündelt KIs zur Frontier; ChatGPT-Voice hört und spricht gleichzeitig; OpenAI-Leak deutet auf wöchentlichen Modell-Takt

Juni 22, 2026

Sakanas Fugu erreicht die Frontier ohne Vendor-Lock-in

Sakanas Fugu bündelt mehrere Modelle hinter einem Endpunkt und erreicht damit Frontier-Niveau, ohne sich an einen Anbieter zu binden. Parallel macht OpenAI den Voice Mode bidirektional, und ein Leak deutet auf einen wöchentlichen Modell-Takt. Dazu spaltet der Rechenzentrums-Ausbau ausgerechnet die, die ihn verkabeln.

Sakana stellt das Modell als Schwarm hinter einem Endpunkt

Sakana Fugu: Mehrere KI-Modelle als ein Endpunkt, koordiniert per Reinforcement Learning

Sakana AI koordiniert mit Fugu mehrere spezialisierte Sprachmodelle und liefert sie als einen OpenAI-kompatiblen Endpunkt aus. Ein evolvierter Koordinator verteilt die Rollen Thinker, Worker und Verifier (Paper TRINITY), die Abstimmung zwischen den Agenten wurde per Reinforcement Learning selbst gelernt (Conductor). Auf SWE Bench Pro erreicht das System 73,7 Prozent, auf GPQA-D 95,5 Prozent, damit auf Augenhöhe mit Claude Opus, GPT-5.5 und Gemini 3.1 Pro. Es gibt zwei Stufen: Fugu für Tempo, Fugu Ultra für maximale Qualität. Der eigentliche Hebel für Entscheider ist der fehlende Vendor-Lock-in, das beste Modell pro Aufgabe statt einer Wette auf einen einzigen Anbieter.

Quelle: Sakana

OpenAI-Leak deutet auf neue GPT-Modelle im Wochentakt

OpenAI-Leak: Neue GPT-Modelle offenbar schon im Alpha-Test

Aus dem Tester-Umfeld kursieren konkrete Hinweise auf einen möglichen Release noch in dieser Woche, angeblich am Donnerstag. Im internen Alpha sollen mehrere Checkpoints laufen: ein GPT-5.6 Pro, das von Testern als ungewöhnlich vielseitig beschrieben wird, dazu ein Modell mit dem Arbeitsnamen GPT-Bidi-1, dessen Wissensstand bis August 2025 reicht. Offiziell bestätigt ist nichts, das bewegt sich im Bereich Leak und Spekulation. Das Muster dahinter ist trotzdem eindeutig: Der Takt der Modell-Iterationen wird kürzer, der Abstand zwischen den Generationen schrumpft von Monaten auf Wochen.

ChatGPT-Voice hört und spricht jetzt gleichzeitig

OpenAI rollt eine neue Version des Voice Mode in der ChatGPT-App aus. Bisher liefen Sprachdialoge im Wechsel: einer redet, der andere hört zu. Das neue Modell kann beides parallel, es hört zu, während es spricht. Damit lässt sich unterbrechen, einwerfen und nachhaken, ohne auf eine Pause zu warten, und die KI reagiert mitten im Satz. Für jeden, der Voice-Agenten im Kundenservice, im Vertrieb oder am Empfang einsetzt, verschiebt sich damit die Messlatte. Telefonische KI-Assistenten klingen ab hier nicht mehr nach Ansage, sondern nach Gesprächspartner.

Claude Code verschachtelt Subagenten jetzt fünf Ebenen tief

Claude Code kann Subagenten ab sofort fünf Stufen tief verschachteln. Ein Auftrag oben löst eine ganze Kaskade aus, vom Projekt-Auditor über Struktur-Check und Import-Validator bis zum Dependency-Tracer und Style-Sync. Der Clou liegt im Speicher: Jede Ebene läuft in ihrem eigenen Kontextfenster, arbeitet ihren Teil ab und schickt nur die Zusammenfassung nach oben. Das Hauptmodell ertrinkt nicht in Zwischenschritten, sondern sieht am Ende ein sauberes Ergebnis. Tiefe fünf ist die harte Grenze, der unterste Agent darf nicht weiter spawnen. Für Unternehmen heißt das: komplexe Aufgaben lassen sich in delegierbare Teilprobleme zerlegen, ohne dass ein einzelnes Modell die Übersicht verliert.

NotebookLM bekommt eine Literatur-Matrix

NotebookLM bekommt Lit-Review-Artefakt: Literatur-Matrix aus eigenen Quellen

Google baut in NotebookLM einen neuen Artefakt-Typ namens Lit review. Statt nur Antworten zu liefern, generiert das Tool künftig eine Literature Review Matrix aus den hochgeladenen Quellen: Themen, Argumente und Befunde sauber gegenübergestellt und automatisch verdichtet. Parallel öffnet Google neue Quellen-Typen, Play Books und Lehrbücher sollen direkt einlesbar werden. Aus dem Notiz-Assistenten wird damit eine Recherche-Werkbank, die ganze Quellenberge in eine strukturierte Vergleichstabelle übersetzt. Wer regelmäßig Studien, Reports oder Marktanalysen wälzt, spart sich künftig das manuelle Zusammentragen.

Meta AI bündelt KI-Ergebnisse in einem Artefakt-Speicher

Meta AI bekommt einen Artifacts-Tab im Web

Meta AI zieht eine eigene Artifacts-Sektion ins Web. Präsentationen, Dokumente, Webseiten und alles andere, was der Assistent generiert, landet künftig gebündelt an einem Ort, statt im Chatverlauf zu versickern. Damit schließt Meta zu dem auf, was Claude und ChatGPT mit ihren Canvas- und Artefakt-Ansätzen vorgemacht haben: Der Chat wird zur Produktionsumgebung, in der Ergebnisse bleiben, wiederauffindbar und weiterverwendbar. Für Teams, die KI-Output nicht einmal generieren und dann wieder verlieren wollen, liegt genau hier der Hebel: persistente Arbeitsergebnisse statt flüchtiger Antworten.

Der KI-Bauboom spaltet die, die ihn verkabeln

Der KI-Bauboom spaltet jetzt die, die ihn bauen

Die Hyperscaler verbauen Milliarden in neue Rechenzentren, das Fundament der KI-Welle braucht Strom, Kühlung und vor allem Hände. Ausgerechnet die Elektriker, die diese Anlagen verkabeln, fragen sich jetzt, ob sie auf der richtigen Seite stehen: lukrative Aufträge auf der einen Seite, wachsender lokaler Widerstand gegen Flächenfraß und Energiehunger auf der anderen. Die physische Infrastruktur ist der Engpass, an dem sich entscheidet, wie schnell KI real wird, und gesellschaftliche Akzeptanz wird zum zweiten Engpass neben Chips und Kapital.

Quelle: Wired

Yann LeCun warnt vor der KI-Blase

LeCun legt eine unbequeme Rechnung offen: Die Preise für KI-Dienste steigen, die Betriebskosten sinken, aber längst nicht schnell genug. Die Anbieter schreiben rote Zahlen, einen großen Teil der Nutzung bezahlen am Ende die Investoren. Auf Dauer trägt das nicht. Nur die Schlussfolgerung kippt schnell ins Falsche: Wer daraus liest, KI sei überschätzt, verwechselt eine Finanzierungsfrage mit einer Substanzfrage. Subventionierte Preise sind ein Manöver zur Markteroberung, kein Beleg gegen den Nutzen. Läuft die Förderung aus, verschwindet nicht die Technologie, sondern nur der Schleuderpreis.

Vibe-Coding baut Apps, die offen stehen wie ein Scheunentor

Vibe-Coding: Apps die fertig aussehen, aber offen stehen wie ein Scheunentor

Wer heute eine App per Zuruf an eine KI zusammenbaut, hat in Minuten ein Produkt, das live geht. Was dabei mitgeliefert wird, sieht man nicht: Eine Website zur Nachverfolgung von US-Steuergeldern lief monatelang mit einer versteckten SQL-Injection-Lücke, durch die Fremde die komplette Datenbank hätten übernehmen können. Aufgefallen ist das erst Monate nach dem Launch. Vibe-Coding senkt die Schwelle zum Bauen radikal, aber nicht die Schwelle zum Absichern. Der Abstand zwischen funktioniert und ist sicher wird zur eigentlichen Aufgabe. Die Konsequenz für Unternehmen ist nicht weniger KI im Code, sondern KI plus Review und Security-Layer als Pflicht.

Quelle: The Verge

Die Fußball-WM wird zum Testfeld für KI-Betrug im Industriemaßstab

Die WM wird zum Testfeld für KI-Betrug im Industriemaßstab

Rund um die Fußball-WM 2026 verschwimmt die Grenze zwischen echt und gefälscht. Geklonte Ticketshops, perfekt nachgebaute Anbieter-Websites, künstliche Verkäufer: Was früher am holprigen Deutsch und an krummen Logos erkennbar war, produziert generative KI heute in Sekunden und ohne sichtbaren Fehler. Die Masche skaliert, weil sie fast nichts mehr kostet. Ein einzelner Akteur baut tausende Klon-Seiten, jede überzeugend genug, dass selbst geübte Augen scheitern. Für Unternehmen liegt darin die eigentliche Botschaft: Dieselbe Technologie, die Marketing und Service beschleunigt, senkt auch die Schwelle für Täuschung gegen die eigene Marke. Wer Vertrauen verkauft, muss Echtheit künftig technisch beweisen.

Quelle: Wired

China hat über 47.000 autonome Lieferfahrzeuge im Dauerbetrieb

Was hierzulande noch Pilotprojekt heißt, ist in China längst Infrastruktur. Zum ersten Quartal 2026 sind über 47.000 fahrerlose Lieferfahrzeuge im Dauerbetrieb, dreimal so viele wie noch 2024. Sie übernehmen die letzte Meile bei Paketen, liefern frische Lebensmittel und pendeln Waren durch Industrieparks und Campus-Gelände. Allein die Paketzustellung läuft in mehr als 300 Städten. Während anderswo noch über autonome Logistik diskutiert wird, baut China still und in der Breite das Rückgrat einer durchautomatisierten Warenwirtschaft.

Ein Roboterhund, groß genug zum Reiten

In einem Robotik-HQ in Shanghai sitzt jemand auf einem vierbeinigen Roboter und lässt sich tragen wie auf einem Pony. Kein Spielzeug, sondern ein vollwertiger Quadruped, der das Gewicht eines Menschen stabil über den Boden balanciert. Was vor zwei Jahren im Labor noch wackelte, trägt heute Erwachsene durch die Halle. Genau diese Lastfähigkeit und Balance, hier beiläufig demonstriert, ist das, was solche Plattformen bald in Lager, Baustellen und Logistik bringt.

Tool-Empfehlung: Voicely

Voicely ist eine DSGVO-konforme Diktiersoftware mit KI-gestützter Spracherkennung, die in jeder App läuft. Wer viel schreibt, kommt damit laut Anbieter rund fünfmal schneller voran als beim Tippen. Ein nützlicher Werkzeugkasten-Eintrag für alle in der KI-Bubble, die nicht nur über Produktivität reden, sondern den eigenen Schreiballtag tatsächlich beschleunigen wollen: voicely.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?