Modelle & Agenten

Baidu stellt DuMate vor:
KI-Agent für Word, Excel und PowerPoint
Der chinesische Suchgigant launcht einen Enterprise-Desktop-Agenten auf OpenClaw-Basis — mit nativem Office-Support und erweiterbaren Skills.

ServiceNow-CEO: Gen Z muss sich auf 30 Prozent Arbeitslosigkeit einstellen
Bill McDermott prognostiziert dramatische Folgen der KI-Automatisierung für Berufseinsteiger. ServiceNow setzt gleichzeitig voll auf KI-Agenten.

Grok sprengt den Browser:
xAI plant Desktop-App mit 8 autonomen Agenten
Während die Konkurrenz noch an isolierten Chatbots baut, bereitet Elon Musk den direkten Zugriff auf das lokale Betriebssystem vor – und dominiert aktuelle Benchmarks.

PlayerZero Déjà Vu:
Wenn korrekter Code das System zum Absturz bringt
Ein neuer Benchmark deckt einen massiven blinden Fleck auf: Reine KI-Codeassistenten übersehen 83 Prozent aller kritischen Produktionsfehler.

Andrej Karpathy: Keine Codezeile mehr seit Dezember — die neue Realität der Softwareentwicklung
Karpathy beschreibt im Podcast, wie er 16 Stunden täglich an Agenten delegiert, sein Smart Home per WhatsApp steuert und mit AutoResearch den vollautomatischen Forschungszyklus baut.

Cursor Composer 2: 50-Personen-Team schlägt Anthropic und OpenAI bei Coding-Benchmarks
Ein eigenentwickeltes Modell übertrifft Claude Opus 4.6 und GPT-5.4 — zum Bruchteil der Kosten. Die Ära der spezialisierten KI-Modelle beschleunigt sich.

Xiaomi MiMo-V2-Pro: Das Rätsel Hunter Alpha ist gelöst
Das mysteriöse Stealth-Modell auf OpenRouter stammt nicht von DeepSeek — sondern von Xiaomi. Mit einer Billion Parametern und kostenloser Nutzung mischt der Smartphone-Konzern die KI-Szene auf.

MiniMax M2.7: Das erste KI-Modell, das sich selbst trainiert?
Chinas MiniMax veröffentlicht M2.7 mit Self-Evolution-Fähigkeit. Das Modell kann an seinem eigenen Training teilnehmen und übernimmt 30 bis 50 Prozent typischer F-und-E-Aufgaben.

Codex bekommt Subagenten:
OpenAIs KI-Agenten lernen delegieren
1,6 Millionen Entwickler nutzen Codex bereits wöchentlich. Jetzt können die Agenten spezialisierte Unteragenten starten — jeder mit eigenem Modell eigenen Anweisungen und eigener Sandbox.

Lebenszeichen von Mistral:
Drei Modelle werden eins
Das französische KI-Unternehmen verschmilzt Reasoning Coding und Bilderkennung in einem Open-Source-Modell. Dazu eine NVIDIA-Allianz und ein Lean-4-Agent. Reicht das?

The Rise of AI Traffic:
Warum GEO jetzt entscheidend wird
ChatGPT Claude und Gemini schicken immer mehr Besucher auf Websites. Claude wächst 40x Gemini 20x. Für Unternehmen wird GEO — Generative Engine Optimization — zum strategischen Muss.

Manus Desktop: Alle wollen auf den Desktop — und alle bauen dasselbe
Innerhalb weniger Wochen haben OpenAI, Anthropic, Perplexity und Manus praktisch identische Produkte gelauncht: KI-Agenten, die den Computer eigenständig bedienen. Der Trend ist eindeutig.

Die Lunte brennt: Warnung vor der Intelligenzexplosion
Frontier-Forscher sehen rekursive Selbstverbesserung als bevorstehende Realität. Politiker in Washington und London tun sie als Sci-Fi ab. Wer hat recht?

AI Brain Fry: Wenn KI-Agenten das Gehirn überlasten
Eine BCG-Studie belegt: Die Steuerung mehrerer KI-Agenten führt zu mentaler Erschöpfung, Fehlern und Kündigungsabsichten. Token-Verbrauch als KPI verschärft das Problem.

Ein-Mann-Marketingabteilung:
Wie Anthropic mit Claude Code 10x Output erreicht
Austin Lau betrieb Anthropics gesamtes Performance-Marketing zehn Monate lang allein — mit Sub-Agenten, Figma-Automatisierung und MCP-Servern. Die Ergebnisse sind dokumentiert.

Sam Altman: Der Transformer ist nur eine Zwischenstufe — AGI erst der Anfang
OpenAIs CEO sieht eine neue Architektur jenseits des Transformers und erklärt AGI zur Aufwärmübung für das, was danach kommt.

ServiceNow-CEO: KI-Agenten könnten Absolventen-Arbeitslosigkeit über 30% treiben
Bill McDermott warnt in einem CNBC-Interview vor massiver Jobverdrängung durch KI-Agenten — sein eigenes Unternehmen hat bereits 90% des Kundenservice automatisiert.

Yale-Studie: KI-Chatbots überzeugen besser als professionelle Wahlwerbung
19.145 Teilnehmer, sieben Modelle — und alle übertrafen Kampagnenwerbung. Claude war am überzeugendsten, Grok am wenigsten.

OpenClaw-RL: Diese KI wird besser, indem man sie benutzt
Princeton-Forscher entwickeln ein Framework, das jeden KI-Agenten durch normales Arbeiten trainiert — ohne manuelles Feintuning.

Perplexity Computer jetzt auf dem Smartphone
Die Multi-Modell-Plattform ist ab sofort als iOS-App verfügbar — mit Cross-Device-Synchronisation und dem neuen KI-Browser Comet.