Microsoft zahlt für KI mehr als für eigene Mitarbeiter

Token-Kosten überholen Gehälter; DeepSeek senkt V4 Pro um 75 Prozent; Demis Hassabis sieht die Singularität in Reichweite

Mai 23, 2026

Microsoft zahlt für KI mehr als für eigene Mitarbeiter

Microsofts interne Reports legen offen, was Unternehmen reihenweise spüren: Token-Kosten pro Mitarbeiter übersteigen das Gehalt. DeepSeek kontert mit dauerhaften 75 Prozent Discount auf V4 Pro, während Google sein monatliches Token-Volumen in zwei Jahren auf das 330-Fache hochzieht. Daneben rollen Humanoide im 15-Minuten-Takt vom Band und Demis Hassabis sieht die Singularität in greifbarer Nähe.

Microsofts interne Zahlen: KI-Tokens kosten mehr als das Gehalt

Microsofts interne Zahlen: KI ist teurer als die eigenen Mitarbeiter

Die internen Microsoft-Reports legen offen, was Unternehmen gerade reihenweise spüren: Je mehr Mitarbeiter KI-Tools nutzen, desto härter die Rechnung. Token-Verbrauch und Agent-Workflows summieren sich pro Kopf auf Beträge, die das Gehalt übersteigen. Microsoft hatte den eigenen AI-Roll-out als Effizienzhebel verkauft, jetzt wird die Token-Ökonomie zur Kostenstelle, die niemand budgetiert hatte. Der Druck verschiebt sich nach unten: günstigere Modelle, härtere Caching-Strategien, kleinere Agenten-Loops. Wer KI heute ungefiltert in Workflows kippt, finanziert nicht die eigene Produktivität, sondern die Margen seines Modell-Anbieters.

Quelle: Fortune

DeepSeek senkt V4 Pro dauerhaft um 75 Prozent

DeepSeek senkt V4-Pro-Preise dauerhaft um 75 Prozent

DeepSeek macht den Discount permanent. V4 Pro liegt jetzt bei 0,43 Dollar pro Million Input-Tokens und 0,87 Dollar Output, Cache praktisch geschenkt mit 0,003625 Dollar. Das Tech-Paper liefert die Begründung: 27 Prozent weniger Compute und nur 10 Prozent Cache-Verbrauch gegenüber V3.2. Während OpenAI Kapazität wie Strom in Jahresverträgen verkauft und Microsoft an den eigenen Token-Rechnungen schluckt, fährt China die Effizienz hoch und drückt die Preise Richtung Grenzkosten. Für DACH-Teams, die Workflows auf Open-Weights-Modelle migrieren, sinkt die Latte für positiven ROI noch einmal spürbar.

Chart des Tages: Google verdreihundertfacht sein Token-Volumen in zwei Jahren

Quelle: Sundar Pichai, Google I/O 2026

Im Mai 2024 lag Googles monatlicher Token-Durchsatz noch bei 9,7 Billionen, ein Jahr später bei rund 480 Billionen, heute im Mai 2026 bei 3.200 Billionen. Faktor 330 in 24 Monaten. Das ist nicht nur ein Wachstumssprung, sondern die neue Grundlast von Suche, Workspace und den Gemini-Modellen. Jede Anfrage, die früher als Link beantwortet wurde, läuft heute durch ein Modell und kostet Tokens. Wer in dieser Größenordnung Compute orchestriert, baut die Infrastruktur, auf der die nächste Software-Generation läuft. Für alle anderen verschiebt sich die Frage von ‘Wie viel KI nutzen wir?’ zu ‘Wie viel Compute können wir uns leisten?’.

Google launcht Gemini Omni: Video-Bearbeitung im Konversations-Modus

Google bringt das Nano-Banana-Prinzip jetzt auf Bewegtbild. Das neue Modell Gemini Omni erzeugt und bearbeitet Video im Dialog: Clip anliefern, Anweisung tippen, Ergebnis zurückbekommen. Schnitt, Stil und Szenenwechsel laufen über reine Sprachsteuerung. Damit greift Google die Postproduktions-Schiene frontal an, in der Veo bisher nur als Generator auftrat. Wer KI für Kurzformate, Werbeclips oder Reels einsetzt, muss seinen Stack ab jetzt gegen ein Modell vergleichen, das nicht nur generiert, sondern in derselben Session weiter iteriert.

ChatGPT füllt Formulare per Sprache aus

OpenAI verknüpft Image Upload und Voice Mode zu einem neuen Workflow: Foto vom Formular hochladen, durchsprechen was reinkommt, fertig ausgefülltes Dokument zurückbekommen. Der eigentliche Sprung steckt unter der Haube. Das Vision-Modell erkennt Felder, der Voice-Stack transkribiert Antworten, derselbe Kontext schreibt zurück ins Bild. Drei Modalitäten in einem Durchgang, ohne App-Wechsel und ohne Tippzeile. Für Selbstständige und Mittelstand heißt das konkret: Steuerformulare, Versicherungsbögen, Anträge und Reisekostenabrechnungen. Die Stunden, die jeden Monat in Behörden-PDFs versacken, schrumpfen auf ein paar Minuten Sprechen.

Project Genie verwandelt jeden Street-View-Ort in eine begehbare Simulation

Project Genie von Google DeepMind dockt jetzt an Google Maps Street View an. Jeder echte US-Ort lässt sich damit in eine begehbare, interaktive 3D-Welt verwandeln, generiert aus den Panorama-Aufnahmen, die Google seit Jahren weltweit einsammelt. Was bisher als Demo durch akademische Paper geisterte, sitzt mit einem Schlag auf einer Datenbasis von Milliarden gemappter Straßenzüge. Wenn ein Modell jedes Pixel der physischen Welt als Eingabe verarbeitet und daraus konsistente, navigierbare Räume baut, wird daraus eine universelle Simulationsschicht. Darin trainieren Agenten, drehen Filmstudios und bauen Spieleentwickler, ohne je eine Polygon-Engine anzufassen.

GPT-5.5 Pro baut die ISS in CAD per Prompt

GPT-5.5 Pro generiert ein vollständiges 3D-Modell der Internationalen Raumstation in ForgeCAD. Solarpaneele, Module und Andockstellen, alles parametrisch konstruiert. Was bisher Wochen an CAD-Arbeit gekostet hat, läuft jetzt per Prompt. Die Grenze zwischen Sprachmodell und Engineering-Tool verschwimmt: Das Modell versteht räumliche Geometrie, Hierarchien und Bauteilbeziehungen gut genug, um industrielle CAD-Workflows direkt zu bedienen. Für Hardware-Teams ist das ein Bruch. Wer bisher dedizierte CAD-Engineers für Konzept-Modelle gebraucht hat, kann jetzt eine Idee in wenigen Sätzen formulieren und bekommt zurück, was vorher ein ganzes Konstruktionsbüro gebraucht hätte.

EngineAI rollt alle 15 Minuten einen Humanoiden vom Band

In Shenzhen Honghualing läuft EngineAIs neue 10.000-Einheiten-Linie für den T800. Die erste Charge ist offiziell vom Band, Full-Stack in-house: R&D, Fertigung, Qualitätskontrolle und Auslieferung. Die aufgerüstete Linie bringt 40 Prozent mehr Output, fährt 79 Vollqualitätschecks pro Roboter und simuliert 46 Arbeitsbedingungen. Exakt 15 Minuten pro Humanoid vom Kit zur fertigen Einheit. Der virale Kick-the-CEO-T800 wird damit zur ersten ernsthaften Produktions-Story aus China und verschiebt die Diskussion um Humanoide vom Demo-Video Richtung Stückzahl.

Tesla öffnet Fremont-Halle für eine Million Optimus pro Jahr

Beim Handover der letzten Model S und X öffnet Tesla die Tore zu der Halle, in der ab nächstem Jahr Optimus gebaut werden soll. Geplante Kapazität: eine Million Einheiten jährlich. Franz von Holzhausen kündigt an: ‘Beim nächsten Besuch ist hier alles voll mit Robotern.’ Elon Musk legt nach: ‘Beim nächsten Handover übergibt Optimus sich selbst.’ Fremont war vier Jahre in Folge die produktivste Autofabrik Nordamerikas. Ab 2027 soll von dort mehr humanoide Hardware kommen als irgendwo sonst in der westlichen Hemisphäre.

Supply-Chain-Angriff infiziert über 700 GitHub-Repositories

Supply-Chain-Angriff auf 700+ GitHub-Repositories trifft PHP- und Node.js-Ökosystem

Über 700 GitHub-Repositories wurden mit Schadcode geflutet, darunter zentrale PHP- und Node.js-Projekte. Beim Installieren zieht das Paket im Hintergrund eine Linux-Datei nach, tarnt sie als /tmp/.sshd und führt sie aus. Sicherheitschecks beim Download werden übersprungen, Fehlermeldungen unterdrückt. Acht PHP-Pakete auf Packagist sind bestätigt infiziert. Der Trick: Das Skript versteckt sich in package.json statt composer.json, genau dort wo PHP-Entwickler nicht hinschauen. Besonders kritisch sind devdojo/wave mit 6.400 Stars und devdojo/genesis mit 9.100 Installs, zwei populäre Laravel-Templates. Auch GitHub Actions wurde getroffen: Ein gefälschter Build-Step namens Dependency Cache Sync schleuste die Payload in Firmen-CI-Pipelines.

Perplexity öffnet Bumblebee als Open-Source-Scanner für Entwickler-Maschinen

Perplexity veröffentlicht Bumblebee als Open-Source-Sicherheitsscanner

Die Lieferkette ist die weiche Flanke moderner Softwareentwicklung, und genau dort setzt Bumblebee an. Perplexity hat das Tool als Open Source veröffentlicht: ein reiner Lese-Scanner für macOS und Linux, der Entwicklermaschinen auf riskante Pakete, Browser-Erweiterungen und Konfigurationen von KI-Tools abklopft. Kein Eingriff, kein Schreibzugriff, nur eine Bestandsaufnahme dessen, was auf der Maschine wirklich läuft. Der eigentliche Hebel liegt in der Anbindung an Computer, den Agenten von Perplexity. Taucht eine neue Supply-Chain-Bedrohung auf, lässt sich automatisch ein tieferer Scan auslösen. Für Unternehmen heißt das: Die Angriffsfläche der eigenen Dev-Teams wird nicht einmal im Quartal geprüft, sondern reagiert auf die Bedrohungslage in dem Moment, in dem sie entsteht.

Demis Hassabis sieht die Singularität in wenigen Jahren

Demis Hassabis rechnet damit, dass echte AGI in wenigen Jahren ankommt und die Singularität in Bewegung setzt. Der Google-DeepMind-Chef nennt das Ganze ‘die wichtigste Technologie aller Zeiten’, transformativer als alles bisher Dagewesene. Bemerkenswert ist weniger die These selbst, sondern wer sie ausspricht: der Mann, der genau das Modell baut, das den Übergang auslösen soll. Aus dem Mund eines Labor-Chefs ist das keine SciFi mehr, sondern eine Roadmap.

Tool-Empfehlung: Voicely

Voicely ist eine DSGVO-konforme Diktiersoftware mit KI-gestützter Spracherkennung, die in jeder App läuft. Wer viel schreibt, spart laut Anbieter rund 20 Stunden pro Monat. Ein nützlicher Werkzeugkasten-Eintrag für alle in der KI-Bubble, die nicht nur über Produktivität reden, sondern den eigenen Schreiballtag tatsächlich beschleunigen wollen: voicely.de.

KI Bubble

Diskussion über diese Post

Sind Sie bereit für mehr?