Die KI Woche #20: KI in großer Studie viel besser als Ärzte - und EU verschiebt KI-Auflagen
Google DeepMinds SymptomAI-Studie übertrifft Ärzte in der bislang größten klinischen Studie. a16z erklärt KI-Jobverluste zur kompletten Fantasie - während in einem Parallel-Universum PayPal, Cloudflare & Co. neue Entlassungswellen einläuten.
METR: Claude Mythos Preview sprengt die Messskala - und Anthropics Risikobericht erntet Kritik
KI-Startup feiert sich dafür, die Spieleentwickler zu killen - und vergisst dabei nur eine Sache...
a16z erklärt KI-Jobverluste zur Fantasie — die eigene Kommentarsektion widerlegt sie
Claude for Microsoft 365: Anthropic bringt KI-Agenten in Office — und erobert die Inbox
Neuralinks Chirurgieroboter zielt auf jede Hirnregion — 21 Neuralnauten zeigen, was das bedeutet
Aktuelle Analysen
EU verschiebt die härtesten KI-Auflagen um 16 Monate - und nennt es Vereinfachung
Rat und Parlament einigen sich auf Omnibus VII: Hochrisiko-Fristen wandern auf Dezember 2027, Wasserzeichen-Pflicht kommt bis Dezember 2026, nicht-einvernehmliche KI-Inhalte werden verboten.
Jedes KI-Bild trägt einen unsichtbaren Fingerabdruck - und die meisten Nutzer wissen es nicht
GPT Image 2 bettet C2PA-Metadaten ein, Google brennt SynthID direkt in die Pixel. Beide Markierungen überleben Screenshots, Zuschnitte und Kompression. Die EU-Wasserzeichen-Pflicht kommt im Dezember.
KI-Agenten kommen in der US-Wirtschaft an: Entlassungswelle erreicht neuen Höhepunkt
Kyndryl streicht 10.000 Stellen, BILL 30 Prozent, Cloudflare 1.100, PayPal 20 Prozent, Upwork 24 Prozent, Coinbase 14 Prozent, Commerzbank 3.000. Die CEOs nennen KI als Grund. Der Markt belohnt sie mit steigenden Kursen.
World Labs: Fei-Fei Lis Marble verwandelt Text in exportfertige 3D-Welten
Das Startup der Stanford-Koryphäe liefert neue Marble-Updates für 3D-Weltgenerierung mit Echtzeit-Editing, Chisel-Sculpting und direktem Export für Unity und Unreal Engine.
Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena
Der chinesische Tech-Konzern schrumpft die Parameter auf ein Drittel, halbiert die aktiven Parameter und trainiert für 6 Prozent der üblichen Kosten. Agenten-Fähigkeiten sollen DeepSeek-V4-Pro übertreffen.
Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg
Die Sicherheitsforschungsgruppe zeigt erstmals in einem Peer-Reviewed Paper, dass Sprachmodelle autonom Schwachstellen finden, ausnutzen und ihren kompletten Inference-Stack auf kompromittierte Rechner übertragen. Claude Opus 4.6 gelingt das in 81 Prozent der Versuche.
Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht
Der interne Leitfaden des Agents-Teams zeigt: Skills sind keine Dokumentation und kein Code. Sie sind eine eigenständige Disziplin mit eigenen Anti-Patterns - und die halbe Python-Zen-Philosophie ist dabei falsch.
SymptomAI: Google DeepMinds KI diagnostiziert besser als Ärzte — in der bislang größten randomisierten Studie
13.917 Fitbit-Nutzer, fünf KI-Strategien, ein klares Ergebnis: Strukturierte KI-Interviews schlagen sowohl freie Chatgespräche als auch menschliche Ärzte bei der Diagnose.
Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2
Leaks zeigen einen Gemini Agent und erste Benchmarks eines Gemini 3.2 Flash. Googles überfällige Antwort auf Claude Cowork, Codex und das dominierende GPT-Image-2.
Mozilla härtet Firefox: Security-Boost durch Claude Mythos Preview
Mit Hilfe von Anthropics neuem Mythos-Modell konnte das Firefox-Team in einem Monat mehr Sicherheitslücken schließen als in den 15 Monaten zuvor.
Google bringt Gemini 3.1 Flash-Lite: Das Arbeitspferd für Agenten und Echtzeit-Workflows
Das bisher kosteneffizienteste Gemini-Modell ist ab sofort verfügbar. JetBrains, Gladly und OffDeal zeigen konkret, warum Low-Latency die nächste Schlüsselgröße ist.
Reactor Inc: Der erste Schritt zu Real-Time World Models
Das Startup präsentiert eine frühe Preview seiner Weltmodelle, die auf einer globalen Low-Latency-Infrastruktur generiert werden.
Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach
Die neuen Modelle bieten GPT-5-Klasse Reasoning in Echtzeit. Gleichzeitig integriert Microsoft GPT-5.5 Instant in M365 Copilot — mit 52 Prozent weniger Halluzinationen.
OpenAI erweitert Codex: Chrome Plugin ermöglicht paralleles Arbeiten in Background-Tabs
Das neue Update erlaubt es der KI, im Hintergrund zu agieren, ohne den Browser komplett zu übernehmen — ein wichtiger Schritt für nahtlose Agenten-Workflows.
Legora aOS: Das Agentic Operating System für die Rechtsbranche
Keine bloße Assistenz mehr: Legora launcht ein durchgängiges System, das rechtliche Workflows von der Mandatsaufnahme bis zum Review komplett steuert.
Google Health Coach: Wenn Gemini zum persönlichen Gesundheitsberater wird
Google startet einen KI-Coach, der aus Wearable-Daten personalisierte Trainings- und Ernährungsempfehlungen generiert. Die Fitbit-App wird zu 'Google Health' — und das neue Fitbit Air liefert die Hardware dazu.
XFRA: NVIDIA und Span bauen das verteilte KI-Rechenzentrum — an der Hauswand
Span nutzt ungenutzte Stromkapazitäten in Wohnhäusern für KI-Inferenz. 16 Blackwell-GPUs pro Node, kein Netzausbau nötig — PulteGroup liefert die ersten Standorte.
Claude lernt träumen: Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower
Dreaming, Outcomes und Multiagent Orchestration: Anthropic rüstet seine Managed Agents massiv auf. Gleichzeitig sichert eine SpaceX-Partnerschaft die nötige Compute-Kapazität.
Microsoft Work Trend Index 2026: 67 % des KI-Erfolgs hängen an der Organisation
20.000 Befragte, Billionen Signale — Microsofts Jahresreport zeigt, warum Kultur und Führung wichtiger sind als jedes Tool.
Grok 4.3 wird zur smartesten KI für Recht und Finanzen
xAIs Modell erobert Platz 1 bei zwei privaten Vals-AI-Benchmarks für juristisches Reasoning und Finanzvertrags-Analyse — und schlägt GPT-5.1 deutlich.
SubQ: Das erste subquadratische Sprachmodell verspricht 1000-fach günstigere Attention
Startup Subquadratic lanciert SubQ 1M-Preview — das erste LLM mit linearer statt quadratischer Skalierung. Benchmarks zeigen Frontier-Leistung bei radikal niedrigerem Rechenaufwand.
Copilot Cowork wird mobil — und verbindet sich mit dem ganzen Unternehmen
Satya Nadella kündigt iOS- und Android-Apps für Microsofts KI-Agenten an. Neue Konnektoren öffnen Copilot Cowork für externe Geschäftssysteme.
GPT-5.5 Instant: OpenAIs ChatGPT antwortet kürzer, wärmer und klüger
Das neue Standardmodell für Hunderte Millionen Nutzer rollt aus — mit natürlicherem Ton und kürzeren Antworten. OpenAI reagiert auf Nutzerfeedback.
Gemma 4 wird 3x schneller — ohne Qualitätsverlust
Google veröffentlicht Multi-Token Prediction Drafter für seine Open-Source-Modellfamilie. Speculative Decoding beschleunigt die Inferenz radikal.
Legora aOS: Das Agentic Operating System für die Rechtsbranche
07. May 2026Google Health Coach: Wenn Gemini zum persönlichen Gesundheitsberater wird
07. May 2026Grok Imagine - das wahrscheinlich meist unterschätzte Bild- und Videomodell
02. May 2026
EU verschiebt die härtesten KI-Auflagen um 16 Monate - und nennt es Vereinfachung
09. May 2026Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg
09. May 20266 Prozent aller Claude-Gespräche sind persönliche Beratung — und bei Beziehungen stimmt Claude zu oft zu
01. May 2026
Musk bei Rogan: Apps sind in 5 Jahren tot
06. May 2026Ilya Sutskevers Gedankenexperiment: Warum KI mehr versteht als ein Papagei
05. May 2026Schneller als Menschen: HONOR-Roboter gewinnt Pekings Humanoid-Halbmarathon
19. Apr 2026
EU verschiebt die härtesten KI-Auflagen um 16 Monate - und nennt es Vereinfachung
Jedes KI-Bild trägt einen unsichtbaren Fingerabdruck - und die meisten Nutzer wissen es nicht
KI-Agenten kommen in der US-Wirtschaft an: Entlassungswelle erreicht neuen Höhepunkt
World Labs: Fei-Fei Lis Marble verwandelt Text in exportfertige 3D-Welten
Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena
Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg
Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht
SymptomAI: Google DeepMinds KI diagnostiziert besser als Ärzte — in der bislang größten randomisierten Studie
Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2
Mozilla härtet Firefox: Security-Boost durch Claude Mythos Preview
Google bringt Gemini 3.1 Flash-Lite: Das Arbeitspferd für Agenten und Echtzeit-Workflows
Reactor Inc: Der erste Schritt zu Real-Time World Models
Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach
OpenAI erweitert Codex: Chrome Plugin ermöglicht paralleles Arbeiten in Background-Tabs
Legora aOS: Das Agentic Operating System für die Rechtsbranche
Google Health Coach: Wenn Gemini zum persönlichen Gesundheitsberater wird
XFRA: NVIDIA und Span bauen das verteilte KI-Rechenzentrum — an der Hauswand
Claude lernt träumen: Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower
Microsoft Work Trend Index 2026: 67 % des KI-Erfolgs hängen an der Organisation
Grok 4.3 wird zur smartesten KI für Recht und Finanzen
SubQ: Das erste subquadratische Sprachmodell verspricht 1000-fach günstigere Attention
Copilot Cowork wird mobil — und verbindet sich mit dem ganzen Unternehmen
GPT-5.5 Instant: OpenAIs ChatGPT antwortet kürzer, wärmer und klüger