Modelle & Agenten

Für 4 Dollar enttarnt:
KI zerstört die Illusion der Online-Anonymität
ETH Zürich und Anthropic zeigen: Handelsübliche KI-Modelle ordnen zwei Drittel pseudonymer Forennutzer ihren realen Identitäten zu — in Minuten, für den Preis eines Kaffees.

Perplexity Computer begeistert erste Tester — mit Vorbehalten
20 Stunden Praxistest, 19 Modelle im Einsatz und ein Nutzer, der 100 Dollar in 90 Minuten verbrannte: Die ersten unabhängigen Reviews sind da.

OpenFang: Ein Betriebssystem für KI-Agenten — gebaut in Rust
137.000 Zeilen Code, 16 Sicherheitsschichten, WASM-Sandboxing: Das Open-Source-Projekt aus Jordanien zeigt, wie autonome Agenten sicher und persistent laufen können.

Workflow-Dämmerung: Warum viele KI-Profis n8n und Make hinter sich lassen
Von deterministischen Wenn-Dann-Ketten zu autonomen Agenten — die Automatisierungsbranche erlebt einen Paradigmenwechsel.

Gehirn und Hände: Warum KI-Systeme mehrere Modelle gleichzeitig brauchen
Google zeigt mit einem Brettspiel-Roboter das Architekturprinzip der Zukunft: Ein Modell denkt, ein anderes handelt.

MaxClaw: MiniMax' KI-Agent läuft rund um die Uhr — direkt in WhatsApp
In zehn Sekunden aktiv, 24/7 verfügbar, zu einem Bruchteil der Kosten von Claude: MaxClaw macht KI-Agenten massentauglich.

Nano Banana 2: Google veröffentlicht seinen besten Bildgenerator
Erste Tests beeindrucken: 4K-Auflösung, irre Detailtreue und multimodales Reasoning statt Diffusion — Nano Banana 2 auf Gemini 3.1 Flash ist da.

Perplexity Computer: 19 Modelle, ein Dirigent — der universelle digitale Arbeiter
Perplexity orchestriert Opus, Gemini, Grok und ChatGPT gleichzeitig zu einem autonomen Projektarbeiter. Die Suchmaschine wird zum Betriebssystem für Wissensarbeit.

Next.js in einer Woche nachgebaut:
Cloudflares KI-Experiment Vinext
Ein Ingenieur, 800 KI-Sessions, 1.100 Dollar — und eine vollständige Reimplementierung von Next.js. Die Frage, die bleibt: Welche Software-Schichten brauchen wir noch?

Anthropic reagiert auf OpenClaw und verpasst Claude Code eine Fernbedienung
Entwickler feiern die neue Remote Control für Claude Code. Ein Lehrstück über Plattformmacht und Disruption.

More intelligence, less compute:
Alibaba veröffentlicht Qwen 3.5
Chinas Open-Source-Offensive geht weiter: Die neuen Modelle überzeugen durch enorme Effizienz auf lokaler Hardware und treiben die Agenten-Demokratisierung voran.

„Demos, not Diffs: Cursors KI-Agenten zeigen ihre Arbeit per Video"
Statt Code-Diffs schicken Agenten jetzt Video-Demos ihrer fertigen Arbeit. 2,8 Millionen Views — und die Frage: Was bleibt vom Software-Burggraben?

Mercury 2: Wie Diffusion LLMs das Monopol der Transformer brechen
Inception Labs stellt das schnellste Reasoning-Sprachmodell der Welt vor — und es basiert nicht auf Autoregression. 1.009 Tokens pro Sekunde durch parallele Diffusion.

Google Opal: Der No-Code-Agent-Builder, der nur natürliche Sprache braucht
Googles stiller Vorstoß in die Agenten-Ära: Opal verwandelt Plain English in vollwertige KI-Workflows — mit Memory, Dynamic Routing und Tool-Calls.

Die neuen Kollegen aus dem Rechenzentrum:
FDM-1 lernt klicken
Standard Intelligence präsentiert das erste Computer-Action-Modell, das direkt aus Millionen Stunden Video lernt — und den PC wie ein Mensch bedient.

Project Genie: Google baut begehbare KI-Welten — und die Gaming-Branche zittert
Google DeepMinds Genie 3 generiert interaktive 3D-Umgebungen per Textprompt. Zelda-Level, Dark-Souls-Mechanik, emergente Physik — und nur 60 Sekunden Session-Limit.

Rekursive Selbstverbesserung:
Wenn KI ihren eigenen Code umschreibt
Im Februar 2026 wird die Theorie zur Praxis. Das Tempo der KI-Entwicklung beschleunigt sich, da Agenten anfangen, sich selbst zu optimieren.

Qwen 3.5: Alibabas Open-Source-Offensive geht in die nächste Runde
Nach DeepSeek und GLM-5 veröffentlicht Alibaba das nächste chinesische Frontier-Modell unter freier Lizenz.

Hyperbolisches Wachstum:
Warum KI schneller wird als exponentiell
METR-Daten zeigen: Von GPT-5 zu Claude Opus 4.6 eine Versiebenfachung in 5 Monaten. Die Exponentialkurve wird nach oben durchbrochen.

METR-Schock: Claude Opus 4.6 sprengt alle Erwartungen
Der Time-Horizon für Software-Aufgaben springt von 5 auf 14,5 Stunden — in nur drei Monaten. Die KI-Community spricht vom Beginn der Singularität.