🤖 Modelle & Agenten
ARC-AGI-3: Der Benchmark, an dem jede KI scheitert
Menschen lösen ihn zu 100 Prozent, die besten KI-Modelle schaffen weniger als 1 Prozent. ARC-AGI-3 misst, was kein anderer Benchmark misst: echte Abstraktionsfähigkeit.
MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht
Mit 8 Milliarden Parametern erreicht MolmoWeb 78 Prozent auf WebVoyager — mit Test-Time Scaling sogar 95 Prozent. Allen AI veröffentlicht Modell, Dataset und Training komplett offen.
AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität
Das Modul von UC Berkeley und NVIDIA entfernt redundante Video-Patches, bevor sie den Vision Transformer erreichen. Ergebnis: 19-facher Speedup und erstmals 4K-Videos mit 1.000 Frames in MLLMs.
HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle
75 Web-Komponenten, 37 Native-Komponenten, Tailwind CSS v4, CSS-only Animationen und ein MCP-Server für KI-Agenten — HeroUI liefert das umfassendste Update seiner Geschichte.
Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen
Die neue Plattform orchestriert mehrere KI-Agenten parallel — Code, Bilder, 3D-Modelle und Daten gleichzeitig. Was Stunden dauerte, soll in Sekunden erledigt sein.
Anthropic zeigt, wie Claude stundenlang autonom programmiert
Drei Agenten — Planer, Generator, Evaluator — arbeiten in Sprints an vollständigen Full-Stack-Apps. Anthropic teilt die Engineering-Details des Harness-Designs, das Claude zum autonomen Software-Entwickler macht.
TurboQuant: Google komprimiert KI-Speicher sechsfach — bei null Genauigkeitsverlust
Der neue Algorithmus reduziert den Key-Value-Cache großer Sprachmodelle um das Sechsfache und beschleunigt die Verarbeitung auf H100-GPUs um das Achtfache. Ohne jedes Nachtraining.
Google NewFront: Gemini übernimmt die Werbeplattform
Google integriert Gemini-Modelle in die gesamte Marketing Platform — von proaktiver Mediakuratierung bis zum Kampagnen-Management per Prompt. Eine Circana-Studie meldet 76 Prozent mehr Rendite.
Claude übernimmt den Desktop: Computer Use macht OpenClaw für viele überflüssig
Anthropics KI steuert jetzt Browser, Maus und Tastatur direkt — und lässt sich per Handy beauftragen. Die Kombination aus Dispatch und Computer Use ersetzt externe Agenten-Frameworks.
Gamma launcht AI-Native Templates: Präsentationen per Prompt umbauen
Mit dem neuen Create-from-this-Button verwandelt Gamma bestehende Decks per Textbefehl in neue Versionen — inklusive 100+ professioneller Vorlagen.
Baidu stellt DuMate vor: KI-Agent für Word, Excel und PowerPoint
Der chinesische Suchgigant launcht einen Enterprise-Desktop-Agenten auf OpenClaw-Basis — mit nativem Office-Support und erweiterbaren Skills.
ServiceNow-CEO: Gen Z muss sich auf 30 Prozent Arbeitslosigkeit einstellen
Bill McDermott prognostiziert dramatische Folgen der KI-Automatisierung für Berufseinsteiger. ServiceNow setzt gleichzeitig voll auf KI-Agenten.