Zum Inhalt springen Modelle & Agenten — Seite 2 — Die KI Woche
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter

🤖 Modelle & Agenten

171 Beiträge · Seite 2 von 15

Mira Muratis Thinking Machines: Das erste KI-Modell, das gleichzeitig zuhört, spricht und sieht
Modelle & Agenten

Mira Muratis Thinking Machines: Das erste KI-Modell, das gleichzeitig zuhört, spricht und sieht

OpenAIs Ex-CTO stellt Interaction Models vor - multimodale Echtzeit-KI mit 276 Milliarden Parametern. Dazu eine Gigawatt-Partnerschaft mit NVIDIA.

Gemini vor der I/O: Overlay, File-Export und Skills machen die App zur Systemschicht
Modelle & Agenten

Gemini vor der I/O: Overlay, File-Export und Skills machen die App zur Systemschicht

Acht Tage vor der Google I/O kippt Google eine Reihe neuer Gemini-Features: Bildschirm-Overlay, direkte Dokumenten-Generierung und wiederverwendbare Prompt-Vorlagen.

38 Minuten, ein fertiges Video: Remotion Agent Skills automatisieren Motion Graphics
Modelle & Agenten

38 Minuten, ein fertiges Video: Remotion Agent Skills automatisieren Motion Graphics

Ein KI-Agent erstellt Motion-Graphics-Videos per Claude Code und Remotion - mit vier Korrekturen in unter einer Stunde. Motion Designer bekommen Konkurrenz aus dem Terminal.

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena
Modelle & Agenten

Baidu ERNIE 5.1: Trainingskosten um 94 Prozent gesenkt - Platz 4 auf LMArena

Der chinesische Tech-Konzern schrumpft die Parameter auf ein Drittel, halbiert die aktiven Parameter und trainiert für 6 Prozent der üblichen Kosten. Agenten-Fähigkeiten sollen DeepSeek-V4-Pro übertreffen.

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg
Modelle & Agenten

Palisade Research zeigt wie KI-Modelle Server hacken und sich selbst kopieren - über vier Länder hinweg

Die Sicherheitsforschungsgruppe zeigt erstmals in einem Peer-Reviewed Paper, dass Sprachmodelle autonom Schwachstellen finden, ausnutzen und ihren kompletten Inference-Stack auf kompromittierte Rechner übertragen. Claude Opus 4.6 gelingt das in 81 Prozent der Versuche.

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht
Modelle & Agenten

Perplexity veröffentlicht das Regelwerk für Agent Skills - und erklärt, warum guter Code schlechte Skills macht

Der interne Leitfaden des Agents-Teams zeigt: Skills sind keine Dokumentation und kein Code. Sie sind eine eigenständige Disziplin mit eigenen Anti-Patterns - und die halbe Python-Zen-Philosophie ist dabei falsch.

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2
Modelle & Agenten

Google I/O Preview: Gemini Agent, neues Modell und der Druck durch GPT-Image-2

Leaks zeigen einen Gemini Agent und erste Benchmarks eines Gemini 3.2 Flash. Googles überfällige Antwort auf Claude Cowork, Codex und das dominierende GPT-Image-2.

Google bringt Gemini 3.1 Flash-Lite: Das Arbeitspferd für Agenten und Echtzeit-Workflows
Modelle & Agenten

Google bringt Gemini 3.1 Flash-Lite: Das Arbeitspferd für Agenten und Echtzeit-Workflows

Das bisher kosteneffizienteste Gemini-Modell ist ab sofort verfügbar. JetBrains, Gladly und OffDeal zeigen konkret, warum Low-Latency die nächste Schlüsselgröße ist.

Reactor Inc: Der erste Schritt zu Real-Time World Models
Modelle & Agenten

Reactor Inc: Der erste Schritt zu Real-Time World Models

Das Startup präsentiert eine frühe Preview seiner Weltmodelle, die auf einer globalen Low-Latency-Infrastruktur generiert werden.

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach
Modelle & Agenten

Voice Intelligence: OpenAI bringt GPT-Realtime-2, Microsoft zieht mit GPT-5.5 Instant nach

Die neuen Modelle bieten GPT-5-Klasse Reasoning in Echtzeit. Gleichzeitig integriert Microsoft GPT-5.5 Instant in M365 Copilot — mit 52 Prozent weniger Halluzinationen.

Legora aOS: Das Agentic Operating System für die Rechtsbranche
Modelle & Agenten

Legora aOS: Das Agentic Operating System für die Rechtsbranche

Keine bloße Assistenz mehr: Legora launcht ein durchgängiges System, das rechtliche Workflows von der Mandatsaufnahme bis zum Review komplett steuert.

Claude lernt träumen: Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower
Modelle & Agenten

Claude lernt träumen: Anthropic macht Agenten selbstlernend — und SpaceX liefert die Rechenpower

Dreaming, Outcomes und Multiagent Orchestration: Anthropic rüstet seine Managed Agents massiv auf. Gleichzeitig sichert eine SpaceX-Partnerschaft die nötige Compute-Kapazität.

🔗 Link kopiert!