KI findet Diagnosen, an denen Ärzte jahrelang scheiterten
OpenAIs o3 löst seltene Kinderkrankheiten; Coding-Agenten richten sich selbst ein; Baseten erreicht 13 Milliarden Dollar
OpenAIs Modell o3 löst seltene Kinderkrankheiten, an denen Ärzte jahrelang scheiterten, während GPT-5.5 die Gesundheitsantworten von ChatGPT ärztlich absichert. Parallel werden Coding-Agenten autonom: Claude Code, Codex und Cursor richten sich ihre Arbeitsabläufe inzwischen selbst ein. Dazu ein möglicher Mathematik-Durchbruch bei den Kosten großer Sprachmodelle und eine 13-Milliarden-Bewertung für reine KI-Infrastruktur.
OpenAIs o3 löst seltene Kinderkrankheiten, an denen Ärzte jahrelang scheiterten
OpenAI hat zusammen mit Forschern des Boston Children’s Hospital und Harvard eine Studie im Fachjournal NEJM AI veröffentlicht. Das Modell o3 Deep Research half Ärzten, ungelöste Fälle seltener Kinderkrankheiten neu aufzurollen, an denen die klassische Diagnostik über Jahre gescheitert war. Die KI durchkämmt medizinische Literatur, verknüpft Symptommuster und Genmarker und legt Hypothesen vor, für die einem einzelnen Arzt schlicht die Zeit fehlt. Die Entscheidung bleibt beim Menschen, die Detektivarbeit übernimmt die Maschine. Genau dort liegt der Wert: nicht als Ersatz, sondern als Sucher, der nie müde wird.
GPT-5.5 macht ChatGPTs Gesundheitsantworten ärztlich geprüft
Mit GPT-5.5 Instant zieht OpenAI die Gesundheits-Kompetenz von ChatGPT nach: stärkeres Reasoning, mehr Kontext pro Anfrage, klarere Kommunikation und Evaluationen, die von echten Ärzten mitgebaut wurden. Gesundheit wird dabei als einer der greifbarsten Hebel beschrieben, an dem sich der Nutzen von AGI im Alltag entscheidet. Für Entscheider heißt das: Das Modell wandert vom Chat-Werkzeug in eine Rolle, in der Antwortqualität medizinisch geprüft wird. Wer KI im Gesundheitskontext einsetzt, bekommt hier den Maßstab geliefert, an dem sich Vertrauen künftig messen lässt.
Quelle: OpenAI
Claude Code baut interaktive Seiten direkt aus der Session
Mit dem neuen Feature Artifacts verwandelt Claude Code eine Arbeits-Session in eine teilbare Oberfläche. Aus dem Kontext der Arbeit entsteht eine interaktive Seite, etwa ein PR-Walkthrough, der Code-Änderungen Schritt für Schritt erklärt, oder ein Projekt-Dashboard, das den Status festhält. Das Ergebnis landet hinter einem privaten Link und geht per Klick ans Team. Der Sprung ist größer als er klingt: Der Assistent dokumentiert nicht mehr nur, was er tut, er produziert das fertige Kommunikations-Artefakt gleich mit. Aus Terminal-Arbeit wird teilbares Wissen. Verfügbar in der Beta auf Team- und Enterprise-Plänen.
OpenAI Codex lernt Workflows durch einmaliges Zuschauen
OpenAI hat für Codex ein Record-and-Replay-Feature ausgerollt. Man zeigt dem System eine wiederkehrende Aufgabe genau einmal, etwa das Einreichen einer Spesenabrechnung oder eines Urlaubsantrags, und Codex verwandelt diese Demo in eine ausführbare, einsehbare und editierbare Skill. Die Aufnahme startet und stoppt auf Befehl, die erzeugte Routine bleibt vollständig kontrollierbar. Damit verschiebt sich Automatisierung von Vorabprogrammierung zu Vormachen. Für die EU, Großbritannien und die Schweiz ist die Funktion vorerst gesperrt, ein Muster, das sich bei neuen KI-Features zunehmend wiederholt.
Cursor richtet sich seine Automatisierungen per Klartext selbst ein
Mit dem neuen Skill /automate beschreibt man eine Aufgabe in normaler Sprache, und der Agent richtet den Rest allein ein: Trigger, Anweisungen und die passenden Tools. Was bisher manuelle Konfiguration war, wird zur Bestellung im Klartext. Der Entwickler sagt, was passieren soll, der Agent entscheidet, wie. Damit verschiebt sich die Arbeit vom Verdrahten einzelner Schritte hin zum Formulieren von Absichten. Ein weiterer Baustein in einer Entwicklung, in der die IDE nicht mehr nur Code ausführt, sondern beginnt, ihre eigenen Arbeitsabläufe selbst zu organisieren.
Perplexity gibt seinem Agenten mit Brain ein Langzeitgedächtnis
Brain heißt das neue, kontinuierlich lernende Speichersystem in Perplexity Computer. Jede Aufgabe klinkt sich in einen Kontext-Graphen ein, den Brain im Hintergrund aufbaut. Das Ergebnis: Der Agent vergisst zwischen den Durchläufen nicht mehr alles, sondern wird mit jedem Run ein Stück zustandsbehafteter und kennt den Faden der vorherigen Arbeit. Vorerst als Research Preview für alle Max-Abonnenten. Der Schritt adressiert die zentrale Schwäche heutiger Agenten: das fehlende Langzeitgedächtnis. Wer Aufgaben über Tage statt über Minuten delegieren will, braucht ein System, das sich erinnert.
MCP bekommt zentrale Enterprise-Authentifizierung für KI-Agenten
Das Model Context Protocol ist still und leise zur Verkabelungsschicht der KI-Welt geworden, über die Modelle auf Tools, Daten und interne Systeme zugreifen. Bisher musste sich jeder Nutzer bei jedem einzelnen Server per OAuth durchklicken. Diese Reibung fällt jetzt weg: Mit der Enterprise-Managed Authorization schalten Unternehmen den Zugriff einmal zentral über ihren Identity-Provider frei, der Mitarbeiter ist beim ersten Login mit allen freigegebenen Servern verbunden. Anthropic, Microsoft und Okta sind bereits dabei. Es ist der Moment, in dem KI-Agenten vom Bastelprojekt zur verwaltbaren Unternehmensinfrastruktur werden.
Quelle: Blog
Subquadratic will den Engpass knacken, der LLMs seit Jahren bremst
Das Miami-Startup Subquadratic kam vor einem Monat aus dem Stealth, mit einer großen Behauptung: Ein mathematischer Engpass, der große Sprachmodelle seit fast einem Jahrzehnt bremst, sei gelöst. Gemeint ist die quadratische Last der Attention, die jeden längeren Kontext exponentiell teuer macht. Anfangs waren die Details dünn und die Skepsis groß, jetzt legt das Team Belege nach und teilt konkrete Modelldetails. Überzeugt sind noch nicht alle. Aber wenn der Ansatz hält, verschiebt sich die Ökonomie der KI: längere Kontexte, niedrigere Inferenzkosten, schnellere Modelle.
Quelle: Technologyreview
Opus 4.8 hebt mit Text-to-CAD Skills den CADGenBench-Score
CADGenBench prüft, ob ein Modell aus reinem Text funktionsfähige CAD-Geometrie erzeugt. Opus 4.8 kam im Baseline-Lauf auf einen Score von 0,34. Mit gezielten Text-to-CAD Skills ausgestattet stieg der Wert auf 0,38, ein Plus von 0,04 Punkten allein durch besseres Werkzeug-Wissen statt durch ein größeres Modell. Genau das ist die Pointe: Der Sprung kommt nicht aus mehr Rechenleistung, sondern aus dem Domänen-Kontext, den man dem Modell zur Laufzeit mitgibt. CAD galt lange als Bastion menschlicher Ingenieure. Jetzt schiebt sich generative KI Schicht für Schicht in den Konstruktionsprozess.
Baseten sammelt 1,5 Milliarden Dollar bei 13-Milliarden-Bewertung
Das KI-Infrastruktur-Startup Baseten steht laut Branchenberichten kurz vor einer Finanzierungsrunde über 1,5 Milliarden Dollar, bei einer Bewertung von 13 Milliarden. Bemerkenswert: Die letzte Mega-Runde liegt erst wenige Monate zurück. Baseten verkauft kein eigenes Modell, sondern das Ausführen fremder Modelle in Echtzeit. Genau hier verschiebt sich gerade das große Geld, weil nicht das Trainieren, sondern das millionenfache Ausliefern von KI-Antworten zum eigentlichen Kostenblock und Geschäftsmodell wird. Der Markt bepreist gerade nicht die Modelle, sondern die Leitungen, durch die sie fließen.
Quelle: TechCrunch
Amazon kauft sich mit dem Humanoiden Sprout in die Robotik ein
Fauna Robotics hat mit Sprout einen kleinen Humanoiden gebaut, der bewusst nicht auf Kraft, sondern auf Sicherheit setzt: leichtes Chassis, weiche Hülle, gefahrlos im direkten Kontakt mit Menschen. Er geht, steigt Stufen und dient als Forschungsplattform. Dass ausgerechnet Amazon zugegriffen hat, sagt mehr als jede Roadmap. Der Konzern, der die Lager dieser Welt automatisiert, sichert sich gerade die Hardware für den Schritt aus dem Lager ins Wohnzimmer.
Tool-Empfehlung: CorporateLLM
CorporateLLM ist eine DSGVO-konforme Unternehmens-KI-Plattform, die OpenRouter, Ollama oder jeden OpenAI-kompatiblen Provider in unter einer Minute anbindet und sicher mit dem eigenen Wissen chatten lässt, ab sofort im Free-Plan. Wer in der KI-Bubble nicht nur über Datenschutz und Modellvielfalt diskutiert, sondern beides ohne Vendor-Lock-in ins eigene Unternehmen holen will, findet hier den passenden Werkzeugkasten, mehr Infos: corporatellm.de.






