🤖 Modelle & Agenten
Grok sprengt den Browser: xAI plant Desktop-App mit 8 autonomen Agenten
Während die Konkurrenz noch an isolierten Chatbots baut, bereitet Elon Musk den direkten Zugriff auf das lokale Betriebssystem vor – und dominiert aktuelle Benchmarks.
PlayerZero Déjà Vu: Wenn korrekter Code das System zum Absturz bringt
Ein neuer Benchmark deckt einen massiven blinden Fleck auf: Reine KI-Codeassistenten übersehen 83 Prozent aller kritischen Produktionsfehler.
Andrej Karpathy: Keine Codezeile mehr seit Dezember — die neue Realität der Softwareentwicklung
Karpathy beschreibt im Podcast, wie er 16 Stunden täglich an Agenten delegiert, sein Smart Home per WhatsApp steuert und mit AutoResearch den vollautomatischen Forschungszyklus baut.
Cursor Composer 2: 50-Personen-Team schlägt Anthropic und OpenAI bei Coding-Benchmarks
Ein eigenentwickeltes Modell übertrifft Claude Opus 4.6 und GPT-5.4 — zum Bruchteil der Kosten. Die Ära der spezialisierten KI-Modelle beschleunigt sich.
Xiaomi MiMo-V2-Pro: Das Rätsel Hunter Alpha ist gelöst
Das mysteriöse Stealth-Modell auf OpenRouter stammt nicht von DeepSeek — sondern von Xiaomi. Mit einer Billion Parametern und kostenloser Nutzung mischt der Smartphone-Konzern die KI-Szene auf.
MiniMax M2.7: Das erste KI-Modell, das sich selbst trainiert?
Chinas MiniMax veröffentlicht M2.7 mit Self-Evolution-Fähigkeit. Das Modell kann an seinem eigenen Training teilnehmen und übernimmt 30 bis 50 Prozent typischer F-und-E-Aufgaben.
Codex bekommt Subagenten: OpenAIs KI-Agenten lernen delegieren
1,6 Millionen Entwickler nutzen Codex bereits wöchentlich. Jetzt können die Agenten spezialisierte Unteragenten starten — jeder mit eigenem Modell eigenen Anweisungen und eigener Sandbox.
Lebenszeichen von Mistral: Drei Modelle werden eins
Das französische KI-Unternehmen verschmilzt Reasoning Coding und Bilderkennung in einem Open-Source-Modell. Dazu eine NVIDIA-Allianz und ein Lean-4-Agent. Reicht das?
The Rise of AI Traffic: Warum GEO jetzt entscheidend wird
ChatGPT Claude und Gemini schicken immer mehr Besucher auf Websites. Claude wächst 40x Gemini 20x. Für Unternehmen wird GEO — Generative Engine Optimization — zum strategischen Muss.
Manus Desktop: Alle wollen auf den Desktop — und alle bauen dasselbe
Innerhalb weniger Wochen haben OpenAI, Anthropic, Perplexity und Manus praktisch identische Produkte gelauncht: KI-Agenten, die den Computer eigenständig bedienen. Der Trend ist eindeutig.
Die Lunte brennt: Warnung vor der Intelligenzexplosion
Frontier-Forscher sehen rekursive Selbstverbesserung als bevorstehende Realität. Politiker in Washington und London tun sie als Sci-Fi ab. Wer hat recht?
AI Brain Fry: Wenn KI-Agenten das Gehirn überlasten
Eine BCG-Studie belegt: Die Steuerung mehrerer KI-Agenten führt zu mentaler Erschöpfung, Fehlern und Kündigungsabsichten. Token-Verbrauch als KPI verschärft das Problem.