Modelle & Agenten

Kimi 2.7 und GLM 5.2:
Chinas Frontier-Modelle erhöhen den Druck - während die USA ihr bestes Modell abschalten
Moonshot AI und Zhipu AI zeigen mit Kimi 2.7 und GLM 5.2, dass Chinas KI-Labore den Anschluss an die Weltspitze gefunden haben. Der geopolitische Kontext macht das Timing brisant.

Claude Mythos ist da:
Anthropics stärkstes Modell Fable 5 startet mit angezogener Handbremse
Fable 5 beeindruckt Forscher und Entwickler - doch die Cybersicherheitsfähigkeiten sind komplett deaktiviert und die Guardrails extrem restriktiv.

Claude Fable 5 sorgt für Gerüchte:
Anthropics erstes Modell der Mythos-Klasse kurz vor dem Start?
Gerüchte verdichten sich - das erste Modell einer neuen Mythos-Klasse soll stärkere Guardrails mitbringen.

Das Modell-Feuerwerk geht weiter:
Warten auf Apple Intelligence, GPT-5.6, Gemini 3.5 Pro, Mythos 5 und Sonnet 4.8
Eine außergewöhnliche Woche in der KI-Entwicklung. Fünf neue Modelle von OpenAI, Google, Anthropic und Apple - einige bestätigt, andere Spekulation. Und WWDC startet morgen.

Claude Mythos kommt: Codename Oceanus im Red-Teaming - Launch um den 11. Juni
Erste Outputs begeistern die Community. Oceanus schreibt in 5 Minuten eine eigene 3D-Engine. Red-Teaming läuft, der Release-Termin naht.

LM Studio bringt lokale KI-Modelle aufs iPhone
Locally heißt die neue iOS-App von LM Studio. Sie verbindet sich per LM Link mit dem Desktop und macht große lokale Modelle mobil nutzbar.

Hermes Desktop: Nous Research bringt Open-Source-Agenten auf Mac, Windows und Linux
Mit Hermes Desktop wird der offene KI-Agent zur nativen App. Die Software integriert sich tief in das Betriebssystem und bietet persistentes Gedächtnis sowie isolierte Sandbox-Umgebungen.

Project Solara: Microsoft baut Agent-First-Hardware auf Android-Basis
Auf der Build 2026 zeigt Microsoft zwei Referenzgeräte - Desktop Hub und Wearable Badge - die keine Apps mehr ausführen, sondern ausschließlich KI-Agenten. Die Plattform läuft auf Android, nicht Windows.

Sieben neue MAI-Modelle:
Microsoft setzt auf Hillclimbing-Architektur
Microsoft AI launcht sieben spezialisierte Modelle - von Reasoning über Coding bis Multimodal. Die Hillclimbing-Strategie ersetzt den Alles-in-einem-Ansatz.

Nemotron 3 Ultra: Nvidia liefert das stärkste offene KI-Modell der USA
550 Milliarden Parameter, 55 Milliarden aktiv, 309 Tokens pro Sekunde: Mit Nemotron Ultra greift Nvidia die proprietären Frontier-Modelle an - und veröffentlicht alles als Open Source.

MiniMax M3: Chinas erstes Open-Weight-Modell auf Frontier-Niveau
MiniMax veröffentlicht M3 mit einer neuen Sparse-Attention-Architektur, die eine Million Token Kontext bei einem Zwanzigstel der bisherigen Rechenkosten ermöglicht. In Benchmarks liegt es auf Augenhöhe mit GPT-5.5 und Claude Opus 4.7.

ForecastBench: Können KI-Modelle die Zukunft vorhersagen?
Ein neuer Benchmark testet KI-Prognosen gegen menschliche Superforecaster. Die Modelle holen auf - aber die besten Prognostiker liegen noch vorn.

OpenAI Rosalind Biodefense:
Ein KI-Modell für die Pandemieabwehr - und ein strategischer Schachzug
OpenAI gibt Regierungen und Forschungslaboren Zugang zu GPT-Rosalind, einem Frontier-Modell für Biosicherheit. Die Strategie dahinter ist mindestens so interessant wie die Technologie.

Computer nur mit Stimme steuern:
Was GPT-Realtime 2.0 als Betriebssystem-Schnittstelle kann
Ein Entwickler zeigt, wie OpenAIs Echtzeit-Sprachmodell den Computer ohne Tastatur und Maus bedient - und warum das mehr ist als eine Demo.

PiD: NVIDIAs Pixel-Decoder macht KI-Bilder in unter einer Sekunde 4K-scharf
Der neue Decoder vereint Dekodierung und Upscaling in einem Schritt - sechsmal schneller als bisherige Verfahren, Open Source, und läuft auf einer Consumer-Grafikkarte.

Codex Thursday ohne Codex:
OpenAIs geheimnisvoller Nicht-Launch
Statt des erwarteten großen Releases gab es nur ein CLI-Update. Was OpenAI am Mittwoch zurückgehalten hat, bleibt unklar.

Opus 4.8 in der Praxis:
Shader, Spiele und eine Boeing 747 ohne menschliches Zutun
Entwickler testen Anthropics neues Topmodell und staunen: autonomes Debugging, sieben Feedback-Loops, spielbare Browser-Games in einem Prompt. Nicht alles ist perfekt.

Gemini 3.5 Flash schreibt ein Betriebssystem und bootet Doom
93 Subagenten, 15.314 Model Calls, 12 Stunden: Googles Antigravity-Team lässt einen Schwarm KI-Agenten Kernel, Dateisystem und Treiber von Grund auf programmieren.

Claude Opus 4.8 und Dynamic Workflows:
Anthropic legt nach
Neues Topmodell, dynamische Workflows in Claude Code und zurückgesetzte Limits - Anthropic dreht an allen Stellschrauben gleichzeitig.

GPT-5.5 stiehlt im DeepSWE Benchmark allen die Show
Auf dem härtesten Coding-Benchmark der Stunde erreicht OpenAIs Flaggschiff 70 Prozent - 16 Punkte vor dem Zweitplatzierten. Wie das Datacurve-Team Benchmark-Manipulation aufdeckt.