Diese Woche liefert Google DeepMind den bislang stärksten klinischen Beweis: KI diagnostiziert in einer randomisierten Studie mit fast 14.000 Patienten 2,5-mal besser als Ärzte. Im VC-Universum von Andreessen Horowitz erklärt man KI-Jobverluste zur Fantasie - während die vermeintliche Fantasie mit voller Wucht am US-Arbeitsmarkt einschlägt. Und Anthropics Mythos Preview sprengt die Messgrenze unabhängiger Testorganisationen.

GESUNDHEIT & FORSCHUNG

KI diagnostiziert vielfach besser als Ärzte - in der bislang größten klinischen Studie

Google DeepMinds SymptomAI-Studie ist ein Meilenstein: 13.917 echte Patienten, randomisiert, verblindet - der Goldstandard klinischer Forschung. Das Ergebnis: Die KI-Diagnosen waren 2,47-mal wahrscheinlicher korrekt als die Diagnosen unabhängiger Ärzte, die exakt denselben Gesprächsverlauf vorgelegt bekamen.

Besonders aufschlussreich: KI-Agenten, die ein strukturiertes Symptominterview führten - also aktiv nachfragten statt nur zu antworten - waren den freien Chatformaten von ChatGPT oder Gemini signifikant überlegen. Die Studie wurde über die Fitbit-App durchgeführt und fügt sich nahtlos in Googles neuen Health Coach ein, der Wearable-Daten und KI-Beratung kombiniert. SymptomAI liefert jetzt die wissenschaftliche Basis dafür, dass dieser Ansatz funktioniert.

WIRTSCHAFT & GESELLSCHAFT

Venture Capitalist erklärt Job-Verluste durch KI zur Fantasie

Die legendäre VC-Firma Andreessen Horowitz ließ diese Woche mit einem selbst für ihre Verhältnisse kuriosen Blogpost aufhorchen: KI-Jobverluste seien eine komplette Fantasie. Alles andere: Alarmismus, Doomer, Panik. Die eigene Kommentarsektion hat das anders gesehen - und in der Realität ist das Memo auch noch nicht angekommen:

Für den US-Arbeitsmarkt war die erste Mai-Woche verheerend. PayPal streicht 20 % der Stellen, BILL 30 %, Upwork 24 %, Cloudflare 20 %, Coinbase 14 % und so weiter. Die Begründungen reichen von "Wir werden eine AI native company" über "KI mache kleinere Teams produktiver" bis hin zu "Teams und Rollen für das Zeitalter autonomer KI-Agenten neu denken". Sogar die deutsche Commerzbank, wo 3.000 Angestellte gehen müssen, wird von der Tagesschau so zitiert: Zehn Prozent der Arbeit würden durch KI überflüssig.

Da hat es dann fast schon einen Hauch Satire, wenn man sich ansieht, wie sich das KI-Startup Shipper dafür feiert, dass man den Berufsstand der Spieleentwickler "killt" (sic!) - und dabei offenkundig ausblendet, dass man dann wohl selbst den nächsten Platz in der Nahrungskette einnimmt.

MODELLE & TECHNOLOGIE

Mythos Preview sprengt die Messgrenze - METR braucht schwierigere Tests

Anthropics Claude Mythos Preview ist so leistungsfähig, dass die unabhängige Testorganisation METR an ihre Messgrenze stößt. Der 50-Prozent-Zeithorizont - die maximale Aufgabendauer, bei der das Modell noch in der Hälfte der Fälle erfolgreich ist - liegt bei mindestens 16 Stunden. Das heißt: Mythos kann mit relativ hoher Zuverlässigkeit über einen ganzen Arbeitstag hinweg autonom komplexe Aufgaben verrichten.

METR dokumentiert seit 2019 einen exponentiellen Anstieg dieser Fähigkeiten. Parallel dazu hat die Organisation Anthropics eigene Risikoeinschätzung geprüft - und kritisiert die methodische Qualität: zu kleine Stichproben, problematisches Framing, und vor allem ein blinder Fleck für Risiken unterhalb der Vollautomatisierung.

Was diese Fähigkeiten in der Praxis bedeuten, zeigt ein konkretes Beispiel: Mozilla hat mit Mythos Preview in einem Monat mehr Sicherheitslücken in Firefox geschlossen als in den 15 Monaten zuvor.

ETHIK & RECHT

EU verschiebt KI-Auflagen - und unsichtbare Wasserzeichen werden Standard

Zwei regulatorische Entwicklungen, die zusammenhängen: Die EU verschiebt die härtesten AI-Act-Fristen um 16 Monate auf Dezember 2027. Gleichzeitig verkürzt das Omnibus-VII-Paket den Übergangszeitraum für die Wasserzeichen-Pflicht: Bis Dezember 2026 müssen alle KI-generierten Inhalte maschinenlesbar gekennzeichnet werden.

Die technische Infrastruktur dafür existiert bereits: Jedes Bild von GPT Image 2 und Google Gemini trägt heute schon einen unsichtbaren Fingerabdruck. OpenAI nutzt den offenen C2PA-Standard, Google DeepMinds SynthID brennt das Wasserzeichen direkt in die Pixel - es überlebt Screenshots, Zuschnitte und Kompression. Die meisten Nutzer wissen das nicht.

KURZ NOTIERT

🎯 Was das für die Praxis bedeutet

1. KI in der Medizin ernst nehmen: SymptomAI zeigt, dass strukturierte KI-Befragung der freien Chatbot-Nutzung signifikant überlegen ist. Unternehmen im Gesundheitsbereich sollten agentenbasierte Ansätze evaluieren.

2. Personalstrategie überdenken: Sechs CEOs nennen KI diese Woche als expliziten Grund für Massenentlassungen. Wer die eigene Belegschaft nicht proaktiv auf KI-gestützte Workflows vorbereitet, riskiert denselben Schritt unter Druck.

3. EU-Fristen nutzen: Die Verschiebung der Hochrisiko-Deadline auf Dezember 2027 verschafft Luft - aber die Wasserzeichen-Pflicht bis Dezember 2026 und die KI-Kompetenzpflicht bleiben unverändert.

Teilen: