Offene Modelle holen die Frontier ein, China vorneweg
VibeThinker-3B zieht mit den Giganten gleich; OpenAIs GPT-5.5-Cyber patcht automatisch; ASMLs 400-Millionen-Maschine bleibt die Engstelle
Kompakte und offene Modelle rücken den geschlossenen Spitzenmodellen dicht auf den Pelz: Ein Modell mit 3 Milliarden Parametern zieht in Mathe und Code mit Gemini 3 Pro gleich, GLM-5.2 und Mistral OCR laufen self-hosted im eigenen Haus. Parallel verlagert OpenAI mit GPT-5.5-Cyber und Patch the Planet die Sicherheitsarbeit in die Maschine. Und im Hintergrund entscheidet weiter eine 400-Millionen-Dollar-Maschine von ASML, wie schnell das alles überhaupt rechnen kann.
Kompakte und offene Modelle holen die KI-Giganten ein
Ein neues Reasoning-Modell mit nur 3 Milliarden Parametern erreicht auf dem Mathe-Wettbewerb AIME26 94,3 Punkte und 80,2 Prozent Pass@1 auf LiveCodeBench v6. Damit zieht es mit Flaggschiffen wie Gemini 3 Pro, DeepSeek V3.2 und GLM-5 gleich oder übertrifft sie, obwohl diese um Größenordnungen mehr Parameter mitbringen. Der Hebel liegt im Training: curriculares Fine-Tuning, Multi-Domain-Reinforcement-Learning und Self-Distillation. Die These dahinter besagt, dass sich verifizierbares Schlussfolgern in kompakte Modelle pressen lässt, während breites Weltwissen viele Parameter braucht. Im KI-Rennen gewinnt damit nicht nur, wer am meisten Rechenpower stapelt, sondern zunehmend, wer Effizienz beherrscht.
Quelle: arXiv
Während die US-Labs ihre Gewichte hinter API-Mauern verschließen, legt Z.ai mit GLM-5.2 das nächste Modell der Reihe offen auf den Tisch. Die Gewichte sind frei, das Modell läuft quantisiert auf eigener Hardware, ohne Cloud, ohne Token-Rechnung und ohne dass ein Anbieter mitliest. Hier wächst gerade eine zweite KI-Welt heran: ein offenes Ökosystem aus China, das qualitativ an die geschlossenen Frontier-Modelle heranrückt und die Kontrolle zurück an den gibt, der das Modell betreibt. Für Unternehmen mit Anspruch auf Datenhoheit und planbare Kosten verschiebt sich die Frage von welche API buche ich zu welches Modell stelle ich mir selbst hin.
Quelle: Unsloth
OpenAI lässt KI Sicherheitslücken in Maschinengeschwindigkeit schließen
OpenAI hat die volle Version von GPT-5.5-Cyber veröffentlicht, gebaut für autorisierte Defensivarbeit: verwundbaren Code aufspüren, Schwachstellen validieren, Patches entwickeln und Belege für die menschliche Prüfung aufbereiten. Auf dem CyberGym-Benchmark klettert das Modell auf 85,6 Prozent, nach zuvor 81,9 Prozent. Dazu kommt das Codex Security Plugin, das Schwachstellen direkt im Codex findet, prüft und fixt, inklusive Threat-Modeling und Export in vorhandene Tools. Über das neue Daybreak Cyber Partner Program erhalten ausgewählte Sicherheitsanbieter Zugriff auf das Modell, ohne dass der direkte Modellzugang aus der Hand gegeben wird. Die Stoßrichtung ist eindeutig: Lücken nicht nur finden, sondern in Maschinengeschwindigkeit schließen.
OpenAI hat am Montag das Programm Patch the Planet gestartet. Ziel ist es, die Sicherheitslücken in genau der Open-Source-Software zu stopfen, auf der praktisch jede kommerzielle Infrastruktur aufsetzt. Zusammen mit der Security-Firma Trail of Bits sichten Ingenieure die Funde, bevor sie bei den oft ehrenamtlichen Maintainern landen, bauen Patches plus Tests und gießen das Ganze in wiederverwendbare Workflows. Im Maschinenraum arbeitet Codex Security. Der Hebel ist nicht ein neues Modell, sondern die Verschiebung der Last: Wartungsarbeit, die bisher an einzelnen Freiwilligen hing, wird zur Pipeline. Wer Open Source nutzt, und das ist faktisch jedes Unternehmen, erbt die Abwehr gleich mit.
Quelle: TechCrunch
Mistral OCR liest 170 Sprachen im eigenen Rechenzentrum
Der größte ungenutzte Datenschatz vieler Unternehmen liegt in PDFs, Scans und Formularen, also in Inhalten, die keine Maschine sauber lesen konnte. Mistral OCR 4 zielt genau dorthin. Das Modell erreicht SOTA-Niveau bei der Dokumentenerkennung, deckt 170 Sprachen ab und liefert nicht nur Text, sondern Bounding Boxes, also die exakte räumliche Verortung jedes Elements auf der Seite. Tabellen, Layouts und Strukturen bleiben erhalten, statt zu Buchstabensuppe zu zerfallen. Der entscheidende Hebel für den DACH-Mittelstand ist das Self-Hosted-Deployment: Akten, Verträge und Patientendaten müssen das eigene Rechenzentrum nicht verlassen. Damit fällt das größte Compliance-Argument gegen Dokumenten-KI weg, und der Weg vom Papierarchiv zur durchsuchbaren Wissensbasis wird zur Konfigurationsfrage.
Quelle: Mistral
Der KI-Ausbau verschlingt Kapital, Strom und Stellen
Jeder KI-Boom endet an derselben Stelle: am Chip. Und jeder fortschrittliche Chip entsteht in einer Maschine des niederländischen Konzerns ASML. Die neueste Generation, High-NA-EUV, wiegt über 150 Tonnen, kostet 400 Millionen Dollar pro Stück und belichtet Strukturen mit 8 Nanometern Auflösung, indem sie Laser auf winzige Zinntröpfchen feuert, rund 200 Wafer pro Stunde. ASML hält etwa 90 Prozent des Lithografie-Markts, zusammen mit dem Fertiger TSMC ein Duopol, an dem die gesamte KI-Industrie hängt. Startups wollen mit Röntgenstrahlen oder Heliumatomen kontern, ernsthaft wackeln dürfte der Thron aber vor 2030 nicht. Wer über KI-Skalierung redet, redet in Wahrheit über diese eine Engstelle.
Quelle: Technology Review
Innerhalb eines Jahres hat Oracle rund 21.000 Jobs weltweit abgebaut, während der Konzern hunderte Milliarden in KI-Infrastruktur pumpt. Der Schnitt ist kein Sparzwang aus Schwäche, sondern ein Umbau: Personal raus, Rechenleistung rein. Oracle positioniert sich als Cloud-Rückgrat der KI-Welle und richtet die eigene Kostenstruktur konsequent danach aus. Wer das nur als Entlassungswelle liest, übersieht die eigentliche Bewegung. Die Konzerne, die jetzt umschichten, formen sich gerade zur KI-Plattform. Gefährlich wird es für die, die abwarten und glauben, ihr klassisches Geschäftsmodell trage sie noch durch das Jahrzehnt.
Quelle: BBC
In Michigan soll ein KI-Rechenzentrum im Stargate-Format entstehen, mit eigener Nuklear-Komponente und Rückendeckung von Gouverneurin Gretchen Whitmer. Die lokalen Gemeindevertreter reagieren mit einer Kampfansage: Man werde bis zum letzten Atemzug kämpfen. Dahinter steckt ein Muster, das sich gerade überall wiederholt. Die Rechenleistung für die nächste KI-Generation muss physisch irgendwo stehen, und plötzlich verwandeln sich beschauliche Landkreise in Frontlinien zwischen Megawatt-Hunger und Vorgarten. Je leiser und abstrakter KI in der Cloud wirkt, desto lauter wird der Streit um den Acker, auf dem sie tatsächlich rechnet.
Quelle: 404media
Forscher der University of Houston haben ein Material zum Supraleiter gemacht, das bei Normaldruck und 151 Kelvin, also minus 122 Grad, Strom komplett verlustfrei leitet. Der alte Bestwert von 1993 lag bei 133 Kelvin, das sind 18 Grad mehr, ohne dass das Material dauerhaft unter extremem Druck gehalten werden muss. Der Trick heißt Pressure Quenching: Das Material wird erst brutal zusammengepresst, dann schlagartig entspannt und dabei eingefroren, sodass der supraleitende Zustand erhalten bleibt. Bis zur Raumtemperatur fehlen noch rund 140 Grad. Doch jeder Schritt rückt verlustfreie Stromnetze, kompaktere Fusionsreaktoren und schnellere Quantenrechner näher an die Realität.
Quelle: ScienceDaily
Eine Forscherin speichert Daten im Erbgut lebender Bakterien
Während Big Tech Milliarden in Rechenzentren aus Stahl und Beton gießt, hat eine junge Forscherin in Indien nach eigenen Angaben einen funktionierenden Prototyp gebaut, der digitale Daten direkt in die DNA lebender Bakterien schreibt. Budget: rund 600.000 Euro, Arbeitsplatz ein winziges Labor. DNA-Datenspeicher ist kein Hirngespinst, sondern ein ernsthaftes Forschungsfeld: Ein Gramm DNA fasst theoretisch Hunderte Petabyte und übersteht Jahrtausende. Der charmante Twist an dieser Version ist, dass sich der Speicher von selbst vermehrt, weil die Bakterien sich teilen. Eine Festplatte, die man nicht kopiert, sondern züchtet. Kurios ist nicht die Technik, sondern der Größenunterschied zwischen Labor-Budget und Ambition.
Tool-Empfehlung: CorporateLLM
CorporateLLM ist eine DSGVO-konforme Unternehmens-KI-Plattform, die OpenRouter, Ollama oder jeden OpenAI-kompatiblen Provider in unter einer Minute anbindet und Teams sicher mit dem eigenen Wissen chatten lässt, ab sofort im Free-Plan. Wer die offenen und self-hosted Modelle aus dieser Ausgabe nicht nur lesen, sondern im eigenen Betrieb einsetzen will, findet hier den passenden Unterbau, mehr Infos: corporatellm.de.












