Wenn ein ganzes KI-Modell in eine Brotdose passt

GLM-5.2 setzt neuen Open-Weight-Bestwert; nur 6 Prozent der Firmen skalieren KI; Roboter lernen laufen

Juni 17, 2026

Wenn ein ganzes KI-Modell in eine Brotdose passt

Open-Weight-Modelle holen rasant auf: GLM-5.2 setzt mit einer Million Token Kontext den neuen Bestwert unter frei verfügbaren Modellen, ein 3-Milliarden-Parameter-Modell erreicht Coding-Werte in der Liga von Claude Opus 4.5, und ein 235-Milliarden-Modell läuft komplett in einem Mini-PC. Gleichzeitig zeigt eine Befragung von rund 500 KI-Entscheidern, dass erst 6 Prozent der Unternehmen daraus messbaren Geschäftswert ziehen.

GLM-5.2 setzt mit 1 Million Token den Open-Weight-Bestwert

ZAI veröffentlicht GLM-5.2 mit 1M Kontext und SOTA-Wert unter Open-Weight-Modellen

ZAI hat GLM-5.2 auf Hugging Face veröffentlicht, mit einem Kontextfenster von einer Million Token und zwei wählbaren Reasoning-Stufen für Tiefe oder Tempo. Der eigentliche Paukenschlag steht in den Benchmarks: 46,2 Prozent auf DeepSWE, der höchste je gemessene Wert unter frei verfügbaren Modellen. Damit rückt offene KI näher an die geschlossenen Spitzenmodelle. Für Unternehmen entscheidend: GLM-5.2 läuft unter MIT-Lizenz, ist also kommerziell frei nutzbar und selbst hostbar, und das zum gleichen Preis wie der Vorgänger GLM-5.1.

Ein 3-Milliarden-Modell erreicht Coding-Werte wie Claude Opus 4.5

3B-Parameter-Modell erreicht Coding-Benchmarks in der Liga von Claude Opus 4.5

Ein offenes Modell mit gerade einmal 3 Milliarden Parametern erreicht in Coding-Benchmarks Werte in der Liga von Claude Opus 4.5, das um Größenordnungen mehr Gewichte mitbringt. Die Weights liegen frei auf Hugging Face, jeder kann es selbst nachprüfen. Offen bleibt, ob hier ein echter Effizienzsprung gelungen ist oder ob die Benchmarks schlicht das Falsche messen. Genau das entscheidet die Richtung der nächsten Modellgeneration: Reichen 3 Milliarden Parameter wirklich, verschiebt sich KI von Rechenzentren zurück auf lokale Hardware.

Ein 235-Milliarden-Modell läuft komplett in einem Mini-PC

Auf der Bühne hielt Lisa Su einen Mini-PC in der Größe einer Lunchbox in die Höhe, der Qwen3-235B komplett lokal rechnet. Kein Cloud-Zugang, keine dedizierte Grafikkarte. Im Inneren steckt der Ryzen AI Max+ 395 mit 128 GB Unified Memory, davon 110 GB als VRAM nutzbar, der erste x86-Chip, der über 200 Milliarden Parameter auf einem einzigen Die stemmt. Einmalig 1.400 bis 2.500 Dollar statt 200 bis 400 Dollar Cloud-Rechnung pro Monat. Das erste ernsthafte Argument, dass die eigene KI nicht in fremde Rechenzentren gehört.

Nur 6 Prozent der Unternehmen ziehen aus KI echten Geschäftswert

The Six Percent Report: Nur 6 Prozent der Unternehmen skalieren KI erfolgreich

Scale AI und Reuters Insights haben fast 500 leitende KI-Entscheider weltweit befragt. Das Ergebnis: Gerade einmal 6 Prozent der Konzerne setzen KI unternehmensweit produktiv ein, mit messbaren Geschäftsergebnissen. Die übrigen 94 Prozent stecken in Pilotprojekten ohne belegbaren Return, eine frühere MIT-Studie kam auf nur 5 Prozent. Was die Gewinner trennt, ist kein größeres Budget, sondern Methode: messbare Resultate binnen sechs Monaten, ein belastbares Datenfundament und spezialisierte Partner statt reiner Standard-Tools.

Quelle: Scale

400.000 Coding-Sessions zeigen: Fachwissen hebelt die KI-Leistung

400.000 Coding-Sessions ausgewertet: Fachwissen entscheidet, wie viel die KI leistet

Anthropic hat rund 400.000 Claude-Code-Sitzungen zwischen Oktober 2025 und April 2026 analysiert. In einer typischen Sitzung trifft der Mensch die Planungsentscheidungen, was getan wird, die KI übernimmt die Ausführung, wie es getan wird. Der entscheidende Hebel: Je mehr Fachwissen jemand mitbringt, desto mehr Arbeit erledigt die KI pro Anweisung und desto häufiger endet die Sitzung erfolgreich. Bemerkenswert ist, dass die Erfolgsquote quer durch alle großen Berufsgruppen fast auf dem Niveau von Softwareentwicklern liegt. Die KI ersetzt Wissen also nicht, sie verstärkt es.

Quelle: Anthropic

DeepMind halbiert die Bearbeitungszeit für Baugenehmigungen

DeepMind baut zusammen mit der britischen Regierung einen KI-Prototypen, der Bauanträge für Wohnprojekte vorprüft. Die Routinearbeit, die Planungsbehörden seit Jahrzehnten ausbremst, übernimmt jetzt das Modell: Anträge sichten, Dokumente abgleichen, Standardfälle vorsortieren. Ergebnis im Pilot: bis zu 50 Prozent kürzere Bearbeitungszeiten. Die Sachbearbeiter verschwinden dabei nicht, sie konzentrieren sich auf die komplexen Fälle, in denen menschliches Urteil zählt. Wer Verwaltung für unautomatisierbar hielt, sieht hier gerade das Gegenteil entstehen.

Grok Imagine Video 1.5 rendert 720p-Clips in 25 Sekunden

xAI hat Imagine Video 1.5 veröffentlicht, das neue Bild-zu-Video-Modell ist ab sofort generell über die API verfügbar: schärfere Physik, sauberere Bewegung, besserer Ton. Die Fast-Variante läuft bereits in den Consumer-Apps, ein 720p-Clip rendert in rund 25 Sekunden statt zuvor über 40. Aus einem Standbild wird so fast in Echtzeit ein bewegter Shot. Der Sprung von der Sekunde-pro-Frame-Logik zur Near-Instant-Generierung verschiebt, was Videoproduktion überhaupt noch kostet.

Cursor startet ein Git-Hosting, das für Agenten gebaut ist

Cursor Origin: ein Git-Hosting, das für Agenten gebaut ist

Cursor baut die eigene Code-Infrastruktur und steigt mit Origin ins Git-Hosting ein. Teams und KI-Agenten bekommen einen Ort, an dem Code liegt, reviewt und gemeinsam bearbeitet wird, eine Git-Forge für die agentische Ära. Der Unterschied zu den etablierten Anbietern: Origin denkt den Agenten von Anfang an mit, nicht als nachträglichen Bot-Account, sondern als gleichberechtigten Mitarbeiter am Repository. Start ist für den Herbst angekündigt, der Zugang läuft vorerst über eine Warteliste.

Quelle: Cursor

NVIDIA holt die optische Schicht der KI zurück in die USA

NVIDIA baut die optische Schicht der KI in den USA aus: Jensen Huang in Sherman, Texas

KI läuft nicht nur auf Rechenleistung, sie läuft auf Licht. In Sherman, Texas, hat Jensen Huang gemeinsam mit dem Photonik-Spezialisten Coherent den Ausbau der US-Fertigung für fortgeschrittene Photonik markiert. Dahinter steckt die oft übersehene Technik moderner KI-Systeme: Laser und optische Verbindungen, die Daten zwischen zehntausenden Chips bewegen. Während alle über GPUs reden, entscheidet diese optische Schicht zunehmend darüber, wie schnell ein Rechenzentrum überhaupt skalieren kann. Die Lehre für Europa: Wer bei der Infrastruktur abhängig bleibt, verliert Souveränität genau dort, wo sie am teuersten zurückzukaufen ist.

DeepL kauft Mixhalo und greift im Silicon Valley an

Deutschlands KI-Champion greift nach den USA: DeepL kauft Mixhalo

Der Kölner Übersetzungs-Spezialist DeepL übernimmt das US-Unternehmen Mixhalo, dessen Technik Live-Audio in Echtzeit auf die Smartphones eines ganzen Publikums streamt. Zusammengelegt entsteht daraus die nahtlose Live-Übersetzung: ein Vortrag, eine Konferenz, ein Konzert, und jeder Zuhörer bekommt den Ton sofort in seiner eigenen Sprache aufs Ohr. Parallel eröffnet DeepL ein Büro in San Francisco und drückt aufs US-Geschäft. Ein deutsches KI-Unternehmen, das nicht übernommen wird, sondern selbst im Silicon Valley einkauft, das ist die seltenere und interessantere Richtung.

Quelle: TechCrunch

Genesis AI zeigt einen Roboter, der nicht mehr menschlich aussieht

Genesis AI zeigt Eno: Der humanoide Roboter, der nicht mehr menschlich aussieht

Das französische Startup Genesis AI, finanziert unter anderem vom früheren Google-Chef Eric Schmidt, stellt seinen Roboter Eno vor. Kein Kopf, keine klassischen Beine, stattdessen eine fahrbare Basis, die sich zusammenklappen lässt wie ein Liegestuhl. Die Leitidee bricht mit dem Hype um menschenähnliche Maschinen: Ein Roboter muss nicht aussehen wie ein Mensch, er muss können, was ein Mensch kann. Designt wird um die Fähigkeit herum, nicht um die Optik. Die menschliche Form ist oft nicht die effizienteste.

Quelle: The Verge

NVIDIA bringt Robotern mit einer einzigen KI das Gehen bei

NVIDIA hat ein neuronales Netz gebaut, das Bewegung in Echtzeit erfindet. MotionBricks erzeugt 15.000 Frames pro Sekunde bei 2 Millisekunden Latenz, trainiert auf 350.000 Bewegungsclips. Kein Animationsgraph, keine handgebauten Übergänge: Man sagt dem Modell, geh dorthin, heb das Schwert auf, und es rechnet Fußplatzierung, Balance und Übergänge selbst. Derselbe Motor steckt jetzt im GR00T-Stack, der weltweit humanoide Roboter steuert. Die KI, die Spielfiguren animiert, bringt Maschinen das Laufen bei.

Chart des Tages: KI verändert Skills schneller als erwartet

KI verändert Skills schneller als gedacht

Quelle: McKinsey Global Institute

Im frühen Szenario erreicht der Skill Change Index im oberen Quartil 59 Prozent, der Median liegt bei 51 Prozent, das untere Quartil bei 43 Prozent. Im mittleren Szenario fällt die Spanne deutlich niedriger aus: 33, 28 und 23 Prozent. Für Unternehmen heißt das: Nicht jede Fähigkeit wird gleich stark getroffen, aber die Priorisierung von Weiterbildung muss datenbasiert werden. Wer Rollen, Prozesse und Skill-Profile jetzt sauber segmentiert, erkennt früher, wo KI echte Arbeitsanteile verschiebt und wo menschliche Fähigkeiten wichtiger werden.

Tool-Empfehlung: CorporateLLM

CorporateLLM ist eine DSGVO-konforme Unternehmens-KI-Plattform, die OpenRouter, Ollama oder jeden OpenAI-kompatiblen Provider in unter einer Minute anbindet und sicher mit dem eigenen Wissen chatten lässt, ab sofort im Free-Plan. Für alle in der KI-Bubble, die lokale oder europäische Modelle nicht nur diskutieren, sondern ihre eigenen Daten produktiv und ohne Vendor-Lock-in nutzen wollen, ein praktischer Einstieg, mehr Infos: corporatellm.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?