Zum Inhalt springen
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena 09. Mai
Modelle & Agenten

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena

Der chinesische Tech-Konzern schrumpft die Parameter auf ein Drittel, halbiert die aktiven Parameter und trainiert für 6 Prozent der üblichen Kosten. Agenten-Fähigkeiten sollen DeepSeek-V4-Pro übertreffen.

KA
Kai
· 09. Mai 2026 · 3 Min. Lesezeit
METR: Claude Mythos Preview sprengt die Messskala - und Anthropics Risikobericht erntet Kritik 09. Mai
Unternehmen & Märkte

METR: Claude Mythos Preview sprengt die Messskala - und Anthropics Risikobericht erntet Kritik

Das KI-Sicherheitsinstitut METR schätzt den Zeithorizont von Mythos Preview auf mindestens 16 Stunden - am Limit der eigenen Testkapazität. Gleichzeitig zerpflückt ein unabhängiger Review die Methodik in Anthropics Risikobewertung.

LA
Laura
· 09. Mai 2026 · 4 Min. Lesezeit
Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg 09. Mai
Modelle & Agenten

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg

Die Sicherheitsforschungsgruppe zeigt erstmals in einem Peer-Reviewed Paper, dass Sprachmodelle autonom Schwachstellen finden, ausnutzen und ihren kompletten Inference-Stack auf kompromittierte Rechner übertragen. Claude Opus 4.6 gelingt das in 81 Prozent der Versuche.

KA
Kai
· 09. Mai 2026 · 4 Min. Lesezeit
Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht 08. Mai
Modelle & Agenten

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht

Der interne Leitfaden des Agents-Teams zeigt: Skills sind keine Dokumentation und kein Code. Sie sind eine eigenständige Disziplin mit eigenen Anti-Patterns - und die halbe Python-Zen-Philosophie ist dabei falsch.

KA
Kai
· 08. Mai 2026 · 5 Min. Lesezeit
KI-Startup feiert sich dafür, die Spieleentwickler zu killen - und vergisst dabei nur eine Sache... 08. Mai
Spaß & Unterhaltung

KI-Startup feiert sich dafür, die Spieleentwickler zu killen - und vergisst dabei nur eine Sache...

Shipper.now und die Vibe-Coding-Szene feiern das Ende der Spieleentwickler. Doch wer über API-Schnittstellen der Frontier-Labs disruptiert, steht selbst am Anfang der Nahrungskette - und merkt es nicht.

NO
Nova
· 08. Mai 2026 · 6 Min. Lesezeit
a16z erklärt KI-Jobverluste zur Fantasie — die eigene Kommentarsektion widerlegt sie 08. Mai
Karriere & Arbeitsmarkt

a16z erklärt KI-Jobverluste zur Fantasie — die eigene Kommentarsektion widerlegt sie

Andreessen Horowitz nennt die Angst vor KI-Jobverlusten eine 'complete fantasy'. Doch die fundierteste Kritik kommt aus der eigenen Leserschaft — und von Praktikern, die täglich Backoffice-Teams durch KI ersetzen.

LA
Laura
· 08. Mai 2026 · 8 Min. Lesezeit
SymptomAI: Google DeepMinds KI diagnostiziert besser als Ärzte — in der bislang größten randomisierten Studie 08. Mai
Forschung & Wissenschaft

SymptomAI: Google DeepMinds KI diagnostiziert besser als Ärzte — in der bislang größten randomisierten Studie

13.917 Fitbit-Nutzer, fünf KI-Strategien, ein klares Ergebnis: Strukturierte KI-Interviews schlagen sowohl freie Chatgespräche als auch menschliche Ärzte bei der Diagnose.

KA
Kai
· 08. Mai 2026 · 1 Min. Lesezeit
Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2 08. Mai
Modelle & Agenten

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2

Leaks zeigen einen Gemini Agent und erste Benchmarks eines Gemini 3.2 Flash. Googles überfällige Antwort auf Claude Cowork, Codex und das dominierende GPT-Image-2.

KA
Kai
· 08. Mai 2026 · 3 Min. Lesezeit
Mozilla härtet Firefox: Security-Boost durch Claude Mythos Preview 08. Mai
Sicherheit

Mozilla härtet Firefox:
Security-Boost durch Claude Mythos Preview

Mit Hilfe von Anthropics neuem Mythos-Modell konnte das Firefox-Team in einem Monat mehr Sicherheitslücken schließen als in den 15 Monaten zuvor.

JU
Justus
· 08. Mai 2026 · 2 Min. Lesezeit
Claude for Microsoft 365: Anthropic bringt KI-Agenten in Office — und erobert die Inbox 08. Mai
Office & Produktivität

Claude for Microsoft 365:
Anthropic bringt KI-Agenten in Office — und erobert die Inbox

Neben Excel, Word und PowerPoint steigt Claude nun auch in Outlook ein. Die neue Inbox-Triage sortiert Mails automatisch und entwirft Antworten — alles in einem durchgängigen Kontext über vier Apps.

MI
Mira
· 08. Mai 2026 · 3 Min. Lesezeit
Google bringt Gemini 3.1 Flash-Lite: Das Arbeitspferd für Agenten und Echtzeit-Workflows 07. Mai
Modelle & Agenten

Google bringt Gemini 3.1 Flash-Lite:
Das Arbeitspferd für Agenten und Echtzeit-Workflows

Das bisher kosteneffizienteste Gemini-Modell ist ab sofort verfügbar. JetBrains, Gladly und OffDeal zeigen konkret, warum Low-Latency die nächste Schlüsselgröße ist.

KA
Kai
· 07. Mai 2026 · 2 Min. Lesezeit
Reactor Inc: Der erste Schritt zu Real-Time World Models 07. Mai
Modelle & Agenten

Reactor Inc: Der erste Schritt zu Real-Time World Models

Das Startup präsentiert eine frühe Preview seiner Weltmodelle, die auf einer globalen Low-Latency-Infrastruktur generiert werden.

KA
Kai
· 07. Mai 2026 · 2 Min. Lesezeit
Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach 07. Mai
Modelle & Agenten

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach

Die neuen Modelle bieten GPT-5-Klasse Reasoning in Echtzeit. Gleichzeitig integriert Microsoft GPT-5.5 Instant in M365 Copilot — mit 52 Prozent weniger Halluzinationen.

KA
Kai
· 07. Mai 2026 · 2 Min. Lesezeit
OpenAI erweitert Codex: Chrome Plugin ermöglicht paralleles Arbeiten in Background-Tabs 07. Mai
Office & Produktivität

OpenAI erweitert Codex:
Chrome Plugin ermöglicht paralleles Arbeiten in Background-Tabs

Das neue Update erlaubt es der KI, im Hintergrund zu agieren, ohne den Browser komplett zu übernehmen — ein wichtiger Schritt für nahtlose Agenten-Workflows.

MI
Mira
· 07. Mai 2026 · 2 Min. Lesezeit
Neuralinks Chirurgieroboter zielt auf jede Hirnregion — 21 Neuralnauten zeigen, was das bedeutet 07. Mai
Forschung & Wissenschaft

Neuralinks Chirurgieroboter zielt auf jede Hirnregion — 21 Neuralnauten zeigen, was das bedeutet

Neuralink demonstriert einen OP-Roboter, der flexible Fäden mit 3.000 Elektroden mikrometergenau im Gehirn platziert. 21 Teilnehmer steuern bereits Roboter-Arme und tippen per Gedanken.

KA
Kai
· 07. Mai 2026 · 4 Min. Lesezeit
Legora aOS: Das Agentic Operating System für die Rechtsbranche 07. Mai
Modelle & Agenten

Legora aOS: Das Agentic Operating System für die Rechtsbranche

Keine bloße Assistenz mehr: Legora launcht ein durchgängiges System, das rechtliche Workflows von der Mandatsaufnahme bis zum Review komplett steuert.

KA
Kai
· 07. Mai 2026 · 2 Min. Lesezeit
Google Health Coach: Wenn Gemini zum persönlichen Gesundheitsberater wird 07. Mai
Unternehmen & Märkte

Google Health Coach: Wenn Gemini zum persönlichen Gesundheitsberater wird

Google startet einen KI-Coach, der aus Wearable-Daten personalisierte Trainings- und Ernährungsempfehlungen generiert. Die Fitbit-App wird zu 'Google Health' — und das neue Fitbit Air liefert die Hardware dazu.

LA
Laura
· 07. Mai 2026 · 2 Min. Lesezeit
XFRA: NVIDIA und Span bauen das verteilte KI-Rechenzentrum — an der Hauswand 06. Mai
Infrastruktur

XFRA: NVIDIA und Span bauen das verteilte KI-Rechenzentrum — an der Hauswand

Span nutzt ungenutzte Stromkapazitäten in Wohnhäusern für KI-Inferenz. 16 Blackwell-GPUs pro Node, kein Netzausbau nötig — PulteGroup liefert die ersten Standorte.

AL
Alex
· 06. Mai 2026 · 4 Min. Lesezeit
Claude lernt träumen: Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower 06. Mai
Modelle & Agenten

Claude lernt träumen:
Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Dreaming, Outcomes und Multiagent Orchestration: Anthropic rüstet seine Managed Agents massiv auf. Gleichzeitig sichert eine SpaceX-Partnerschaft die nötige Compute-Kapazität.

KA
Kai
· 06. Mai 2026 · 4 Min. Lesezeit
Microsoft Work Trend Index 2026: 67 % des KI-Erfolgs hängen an der Organisation 06. Mai
Unternehmen & Märkte

Microsoft Work Trend Index 2026:
67 % des KI-Erfolgs hängen an der Organisation

20.000 Befragte, Billionen Signale — Microsofts Jahresreport zeigt, warum Kultur und Führung wichtiger sind als jedes Tool.

LA
Laura
· 06. Mai 2026 · 6 Min. Lesezeit
🔗 Link kopiert!