Modelle & Agenten

Googles Aufholjagd: Leaks und Gerüchte um Gemini 3.5 Pro verdichten sich
Interne API-Einträge, Arena-Tests und ein Polymarket-Wettmarkt deuten auf einen Launch am 17. Juli. Die ersten Ergebnisse sehen stark aus.

Prompt Engineering ist tot — Anthropics Fable-5-Guide definiert die Regeln neu
Vergiss 'Think step by step': Anthropics offizielle Prompting-Anleitung für Fable 5 zeigt, wie radikal sich der Umgang mit KI-Modellen verändert hat.

ZCode 3.0: Zhipu AIs Coding-IDE macht GLM-5.2 zum Komplettpaket
Das chinesische KI-Labor verpackt sein Open-Weights-Topmodell in eine Desktop-App mit Multi-Agenten, Goal Mode und 1-Million-Token-Kontext. Cursor und Claude Code bekommen Konkurrenz aus Peking.

Claude Sonnet 5 unter der Lupe:
Effizienter als Opus und doch überraschend teuer
Die Community testet Anthropics neues Standardmodell. Das Bild ist differenziert: In manchen Benchmarks überlegen, bei den realen Kosten aber eine Überraschung.

Keine Spur von Gemini 3.5 Pro:
Google DeepMind hält die Spannung
Trotz wochenlanger Leaks und Benchmark-Hinweise bleibt Googles nächstes Frontier-Modell unsichtbar - während die Konkurrenz im Stundentakt liefert.

Sonnet 5 ist da: Kannibalisiert Anthropic sein leistungsstarkes Opus 4.8 Modell?
Das agentischste Sonnet aller Zeiten kommt nah an Opus heran - zu deutlich niedrigeren Preisen. Für viele verschwimmt die Grenze zwischen günstig und leistungsstark.

OpenClaw startet native Apps für iOS und Android
Der Open-Source-KI-Agent von Peter Steinberger läuft jetzt direkt auf dem Smartphone - als Companion für das eigene Gateway.

GPT-5.6: OpenAI stellt Sol, Terra und Luna vor - unter staatlicher Aufsicht
Drei Modelle, ein Ultra-Modus mit Sub-Agenten, aggressive Preise - und ein Release, den die US-Regierung kontrolliert. Dazu: METR warnt vor zehnfach mehr problematischem Verhalten.

Ornith-1.0: Open-Source-Modelle optimieren das agentische Coding durch Self-Scaffolding
Mit einem innovativen Reinforcement-Learning-Ansatz trainiert DeepReinforce.AI seine Modelle, den gesamten Ablauf von der Planung bis zur Tool-Nutzung eigenständig zu steuern.

Zhipu AI veröffentlicht GLM-5.2:
Offenes Code-Modell hängt die Konkurrenz ab
Mit extremer Kosteneffizienz, 1-Million-Token-Kontext und starken Leistungen in Coding-Benchmarks schrumpft der Vorsprung kommerzieller Riesen weiter.

Claude Tag: Anthropic macht Claude zum Slack-Teammitglied
Mit Claude Tag bekommt Claude eine eigene Identität in Slack — samt Gedächtnis, Tool-Zugang und Admin-Kontrolle über Kanäle und Budgets.

GPT-Bidi-1: OpenAI baut das bidirektionale Sprachmodell nach
In ChatGPT taucht ein neues Voice-Modell auf, das gleichzeitig zuhören und sprechen kann. Thinking Machines Lab hatte genau das vor sechs Wochen als Erste vorgestellt.

Sakana Fugu: Japans KI-Startup orchestriert fremde Modelle zu Frontier-Leistung
Das Tokioter Startup Sakana AI veröffentlicht Fugu Ultra - ein System, das mehrere KI-Modelle koordiniert und dabei mit Anthropics Fable 5 mithält.

GPT-5.6 offenbar im Early Access:
One-Shot-Demos, 87-Minuten-Sessions und breite Tests
Immer mehr Tester zeigen Ergebnisse eines mutmaßlichen GPT-5.6 Pro. Das Muster erinnert an frühere Modell-Launches - und deutet auf einen baldigen Release hin.

HermesWorld: KI-Agenten als Mitspieler in einem Browser-MMO
Autonome KI-Begleiter, griechische Mythologie und Solana-Token - was hinter dem AI-agent-native Spiel steckt.

Wo bleiben GPT-5.6 und Gemini 3.5 Pro? Neue Leaks deuten auf baldigen Start
Breiter Early Access, API-Einträge, Benchmark-Hinweise - die Indizien für GPT-5.6 verdichten sich. Und auch bei Fable 5 bewegt sich etwas.

Diese Codex Features kommen endlich nach Europa:
Computer Use, Chrome Extension und Memory für die EU
OpenAI rollt die mächtigsten Codex-Features für Nutzer im EWR, der Schweiz und Großbritannien aus. Erstmals können europäische Nutzer sehen, wie ein KI-Agent den Desktop steuert.

Riverflow Pro 2.5: Reasoning-Modell für Bilder erobert drei Arena-Spitzenplätze auf einmal
Ein Reasoning-Modell, das proprietäre und offene Diffusionsmodelle kombiniert, steht auf Platz 1 der Image Arena, der Graphic Design Arena und der Image Edit Arena.

GLM 5.2 überholt US-Frontier-Modelle im Frontend-Coding:
Chinas Open-Weights-Offensive erreicht die Spitze
Zhipus 744-Milliarden-Parameter-Modell ist das erste Open-Weights-Modell über 80 Prozent auf Terminal-Bench. GLM 5.2 holt Platz 1 in der Design Arena im Frontend-Coding und überholt damit sogar Fable 5.

Rio 3.5: Wenn eine Stadtverwaltung ein 397-Milliarden-Parameter-Modell veröffentlicht
Die IT-Abteilung von Rio de Janeiro hat ein Open-Source-KI-Modell auf Basis von Qwen 3.5 trainiert - und erntet damit weltweit Staunen und Skepsis.