Modelle & Agenten

09. Mai

Modelle & Agenten

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena

Der chinesische Tech-Konzern schrumpft die Parameter auf ein Drittel, halbiert die aktiven Parameter und trainiert für 6 Prozent der üblichen Kosten. Agenten-Fähigkeiten sollen DeepSeek-V4-Pro übertreffen.

KA

Kai

· 09. Mai 2026 · 3 Min. Lesezeit

09. Mai

Modelle & Agenten

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg

Die Sicherheitsforschungsgruppe zeigt erstmals in einem Peer-Reviewed Paper, dass Sprachmodelle autonom Schwachstellen finden, ausnutzen und ihren kompletten Inference-Stack auf kompromittierte Rechner übertragen. Claude Opus 4.6 gelingt das in 81 Prozent der Versuche.

KA

Kai

· 09. Mai 2026 · 4 Min. Lesezeit

08. Mai

Modelle & Agenten

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht

Der interne Leitfaden des Agents-Teams zeigt: Skills sind keine Dokumentation und kein Code. Sie sind eine eigenständige Disziplin mit eigenen Anti-Patterns - und die halbe Python-Zen-Philosophie ist dabei falsch.

KA

Kai

· 08. Mai 2026 · 5 Min. Lesezeit

08. Mai

Modelle & Agenten

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2

Leaks zeigen einen Gemini Agent und erste Benchmarks eines Gemini 3.2 Flash. Googles überfällige Antwort auf Claude Cowork, Codex und das dominierende GPT-Image-2.

KA

Kai

· 08. Mai 2026 · 3 Min. Lesezeit

07. Mai

Modelle & Agenten

Google bringt Gemini 3.1 Flash-Lite:
Das Arbeitspferd für Agenten und Echtzeit-Workflows

Das bisher kosteneffizienteste Gemini-Modell ist ab sofort verfügbar. JetBrains, Gladly und OffDeal zeigen konkret, warum Low-Latency die nächste Schlüsselgröße ist.

KA

Kai

· 07. Mai 2026 · 2 Min. Lesezeit

07. Mai

Modelle & Agenten

Reactor Inc: Der erste Schritt zu Real-Time World Models

Das Startup präsentiert eine frühe Preview seiner Weltmodelle, die auf einer globalen Low-Latency-Infrastruktur generiert werden.

KA

Kai

· 07. Mai 2026 · 2 Min. Lesezeit

07. Mai

Modelle & Agenten

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach

Die neuen Modelle bieten GPT-5-Klasse Reasoning in Echtzeit. Gleichzeitig integriert Microsoft GPT-5.5 Instant in M365 Copilot — mit 52 Prozent weniger Halluzinationen.

KA

Kai

· 07. Mai 2026 · 2 Min. Lesezeit

07. Mai

Modelle & Agenten

Legora aOS: Das Agentic Operating System für die Rechtsbranche

Keine bloße Assistenz mehr: Legora launcht ein durchgängiges System, das rechtliche Workflows von der Mandatsaufnahme bis zum Review komplett steuert.

KA

Kai

· 07. Mai 2026 · 2 Min. Lesezeit

06. Mai

Modelle & Agenten

Claude lernt träumen:
Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Dreaming, Outcomes und Multiagent Orchestration: Anthropic rüstet seine Managed Agents massiv auf. Gleichzeitig sichert eine SpaceX-Partnerschaft die nötige Compute-Kapazität.

KA

Kai

· 06. Mai 2026 · 4 Min. Lesezeit

06. Mai

Modelle & Agenten

Grok 4.3 wird zur smartesten KI für Recht und Finanzen

xAIs Modell erobert Platz 1 bei zwei privaten Vals-AI-Benchmarks für juristisches Reasoning und Finanzvertrags-Analyse — und schlägt GPT-5.1 deutlich.

KA

Kai

· 06. Mai 2026 · 2 Min. Lesezeit

06. Mai

Modelle & Agenten

SubQ: Das erste subquadratische Sprachmodell verspricht 1000-fach günstigere Attention

Startup Subquadratic lanciert SubQ 1M-Preview — das erste LLM mit linearer statt quadratischer Skalierung. Benchmarks zeigen Frontier-Leistung bei radikal niedrigerem Rechenaufwand.

KA

Kai

· 06. Mai 2026 · 3 Min. Lesezeit

06. Mai

Modelle & Agenten

GPT-5.5 Instant: OpenAIs ChatGPT antwortet kürzer, wärmer und klüger

Das neue Standardmodell für Hunderte Millionen Nutzer rollt aus — mit natürlicherem Ton und kürzeren Antworten. OpenAI reagiert auf Nutzerfeedback.

KA

Kai

· 06. Mai 2026 · 2 Min. Lesezeit

06. Mai

Modelle & Agenten

Gemma 4 wird 3x schneller — ohne Qualitätsverlust

Google veröffentlicht Multi-Token Prediction Drafter für seine Open-Source-Modellfamilie. Speculative Decoding beschleunigt die Inferenz radikal.

KA

Kai

· 06. Mai 2026 · 2 Min. Lesezeit

06. Mai

Modelle & Agenten

Musk bei Rogan: Apps sind in 5 Jahren tot

Elon Musk vergleicht den App Store mit Blockbuster Video. KI-Agenten übernehmen — man braucht keine Apps mehr, nur noch Absichten.

KA

Kai

· 06. Mai 2026 · 3 Min. Lesezeit

05. Mai

Modelle & Agenten

Ilya Sutskevers Gedankenexperiment:
Warum KI mehr versteht als ein Papagei

OpenAIs Mitgründer zerlegte den populärsten Einwand gegen Sprachmodelle mit einem einzigen Krimi-Szenario. Die Debatte über echtes Verstehen ist damit nicht beendet — aber grundlegend verschoben.

KA

Kai

· 05. Mai 2026 · 4 Min. Lesezeit

04. Mai

Modelle & Agenten

60 Prozent Chance: KI forscht bis 2028 an sich selbst

Anthropic-Mitgründer Jack Clark legt im Import AI Newsletter Benchmarks vor, die zeigen: KI-Systeme kommen der vollständigen Automatisierung von KI-Forschung erschreckend schnell näher.

KA

Kai

· 04. Mai 2026 · 3 Min. Lesezeit

04. Mai

Modelle & Agenten

Unity startet Open Beta:
KI-Agent versteht dein Projekt

Kein Shader-Wissen, kein Boilerplate: Unitys neuer In-Editor-Agent kennt deine Szene, führt Änderungen aus und macht sie auf Knopfdruck rückgängig.

KA

Kai

· 04. Mai 2026 · 3 Min. Lesezeit

02. Mai

Modelle & Agenten

Google testet massives "Gemini 3 Flash" Upgrade in der Arena

In Benchmark-Tests taucht eine neue Version des Modells auf, die bei der Bildgenerierung fast die Leistung des Pro-Flaggschiffs erreicht.

KA

Kai

· 02. Mai 2026 · 2 Min. Lesezeit

01. Mai

Modelle & Agenten

6 Prozent aller Claude-Gespräche sind persönliche Beratung — und bei Beziehungen stimmt Claude zu oft zu

Aus einer Million Claude.ai-Gesprächen: 27% Gesundheit, 26% Karriere, 12% Beziehungen. Das Problem: In Beziehungsgesprächen verhält sich Claude in 25% der Fälle sycophantisch. Opus 4.7 halbiert diesen Wert.

KA

Kai

· 01. Mai 2026 · 3 Min. Lesezeit

01. Mai

Modelle & Agenten

Manus Cloud Computer:
Dein KI-Agent läuft jetzt 24/7 — auch wenn du schläfst

Manus (jetzt Teil von Meta) launcht den Cloud Computer — eine dedizierte Maschine in der Cloud, die Bots, Python-Skripte und Automatisierungen rund um die Uhr betreibt. Das Personal-Computer-Modell der Agenten-Ära.

KA

Kai

· 01. Mai 2026 · 3 Min. Lesezeit

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2

Google bringt Gemini 3.1 Flash-Lite:
Das Arbeitspferd für Agenten und Echtzeit-Workflows

Reactor Inc: Der erste Schritt zu Real-Time World Models

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach

Legora aOS: Das Agentic Operating System für die Rechtsbranche

Claude lernt träumen:
Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Grok 4.3 wird zur smartesten KI für Recht und Finanzen

SubQ: Das erste subquadratische Sprachmodell verspricht 1000-fach günstigere Attention

GPT-5.5 Instant: OpenAIs ChatGPT antwortet kürzer, wärmer und klüger

Gemma 4 wird 3x schneller — ohne Qualitätsverlust

Musk bei Rogan: Apps sind in 5 Jahren tot

Ilya Sutskevers Gedankenexperiment:
Warum KI mehr versteht als ein Papagei

60 Prozent Chance: KI forscht bis 2028 an sich selbst

Unity startet Open Beta:
KI-Agent versteht dein Projekt

Google testet massives "Gemini 3 Flash" Upgrade in der Arena

6 Prozent aller Claude-Gespräche sind persönliche Beratung — und bei Beziehungen stimmt Claude zu oft zu

Manus Cloud Computer:
Dein KI-Agent läuft jetzt 24/7 — auch wenn du schläfst

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Modelle & Agenten

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2

Google bringt Gemini 3.1 Flash-Lite:Das Arbeitspferd für Agenten und Echtzeit-Workflows

Reactor Inc: Der erste Schritt zu Real-Time World Models

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach

Legora aOS: Das Agentic Operating System für die Rechtsbranche

Claude lernt träumen:Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Grok 4.3 wird zur smartesten KI für Recht und Finanzen

SubQ: Das erste subquadratische Sprachmodell verspricht 1000-fach günstigere Attention

GPT-5.5 Instant: OpenAIs ChatGPT antwortet kürzer, wärmer und klüger

Gemma 4 wird 3x schneller — ohne Qualitätsverlust

Musk bei Rogan: Apps sind in 5 Jahren tot

Ilya Sutskevers Gedankenexperiment:Warum KI mehr versteht als ein Papagei

60 Prozent Chance: KI forscht bis 2028 an sich selbst

Unity startet Open Beta:KI-Agent versteht dein Projekt

Google testet massives "Gemini 3 Flash" Upgrade in der Arena

6 Prozent aller Claude-Gespräche sind persönliche Beratung — und bei Beziehungen stimmt Claude zu oft zu

Manus Cloud Computer:Dein KI-Agent läuft jetzt 24/7 — auch wenn du schläfst

Fehler melden

Die KI Woche als App

Google bringt Gemini 3.1 Flash-Lite:
Das Arbeitspferd für Agenten und Echtzeit-Workflows

Claude lernt träumen:
Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Ilya Sutskevers Gedankenexperiment:
Warum KI mehr versteht als ein Papagei

Unity startet Open Beta:
KI-Agent versteht dein Projekt

Manus Cloud Computer:
Dein KI-Agent läuft jetzt 24/7 — auch wenn du schläfst