Modelle & Agenten

Alibaba und Tencent überraschen zeitgleich mit sensationellen neuen Open World Modellen
Zwei 3D-Weltenbau-Modelle in wenigen Stunden: Tencent launcht das Open-Source-Modell HYWorld 2.0 für Engine-Ready-Szenen, Alibaba kontert mit Happy Oyster für interaktive Videoproduktion.

Nemotron 3 Super: NVIDIAs neues KI-Gehirn dominiert bei autonomen Agenten
Mit einem gigantischen Open-Source-Release greift NVIDIA den Agenten-Thron an. Das hocheffiziente 120B-Modell erzielt Bestwerte und gilt als bestes offenes System im Bereich Software-Entwicklung und Reasoning.

Wissen vs. Budget: China schließt mit neuer Effizienz die KI-Lücke zu den USA
Laut dem Stanford AI Index 2026 sind chinesische KI-Modelle technologisch gleichauf mit amerikanischen – obwohl die US-Investitionen fast 23-mal höher ausfallen.

Gemini kommt als native Mac-App:
Kontext-KI für den Desktop
Google bringt seine KI direkt auf den Mac-Schreibtisch: Ein Tastaturkürzel, Kontextverständnis für den aktuellen Bildschirm und integrierte Werkzeuge für die Dateibearbeitung.

Google I/O Leaks: Gemini bekommt Agent-Modus, NotebookLM wird zur Canvas-Plattform
Geleakte Screenshots zeigen autonome Task-Steuerung, Human-Review-Toggle und eine visuelle Canvas-Ebene für NotebookLM. Google baut Gemini zur vollständigen Arbeitsplattform aus.

Claude Opus 4.7 vor dem Start? Große Neuerungen von Anthropic
The Information berichtet exklusiv: Anthropic soll Launch eines neuen Flaggschiff-Modells und eines neuen KI-Design-Tools vorbereiten, das Figma und Adobe noch weiter unter Druck setzen könnte.

Anthropic veröffentlicht Managed Agents:
Der Infrastruktur-Boost für autonome KI
Schluss mit instabilen Prototypen: Anthropic verspricht, die Entwicklungszeit produktionsreifer Agenten-Netzwerke mit der neuen API massiv zu reduzieren.

Google aktualisiert Gemini:
Neue Projekt-Ordner und interaktive Datenanalyse
Mit der Einführung von 'Notebooks' wird die KI zum synchronisierten Projekt-Hub – ergänzt durch anpassbare 3D-Modelle im Chat.

MedGemma 1.5: Google veröffentlicht multimodales KI-Modell für 3D-Klinikdaten
Das kleine 4B-Modell ermöglicht die native Auswertung von MRT-Volumendaten sowie Gewebeschnitten und läuft abseits gigantischer Cloud-Server.

Wenn KI manipuliert: Forscher fordern neue Sicherheitsaudits
Ein großangelegter Test mit 10.000 Probanden zeigt: Sprachmodelle können Menschen manipulieren – aber der Erfolg hängt stark von Kontext und Kultur ab.

Singularität im toten Winkel:
Warum wir die KI-Beschleunigung kollektiv unterschätzen
Während Skeptiker den KI-Winter ausrufen, brechen neue Modelle die Skalierungs-Gesetze. Das Zeitfenster für Sicherheit und Anpassung kollabiert.

GLM-5.1: Chinas Open-Source-Modell schlägt teilweise GPT-5.4 und Opus 4.6 im Coding
Z.ai veröffentlicht sein neues Flaggschiff unter MIT-Lizenz. 58,4 Prozent auf SWE-Bench Pro — Platz 1 bei Open Source und vor allen proprietären Rivalen.

Gemma 4 offline auf dem Smartphone — und Googles Diktat-App macht Cloud-Abos überflüssig
Googles neues Modell läuft als eigenständiger KI-Agent ohne Internet. Die kostenlose Eloquent-App zeigt: Lokale KI ersetzt bereits kostenpflichtige Cloud-Dienste.

Steht OpenAI's neues Image-Modell kurz vor dem Start?
Drei neue rätselhafte Modelle - maskingtape-alpha, gaffertape-alpha, packingtape-alpha sorgen für Begeisterung und Spekulationen im Netz.

Pika PikaStream 1.0: KI-Agenten sitzen jetzt im Video-Call
Das Open-Source-Modell gibt jedem KI-Agenten ein Gesicht und eine Stimme — und tritt selbstständig Google-Meet-Calls bei.

Karpathy verabschiedet sich von RAG:
Das neue 'Second Brain' läuft lokal
Der ehemalige OpenAI-Forschungsleiter setzt für sein Wissensmanagement jetzt auf ein lokales LLM, das seine Obsidian-Notes als strukturierte Wiki kompiliert.

Agentic AI: Warum das 'Gehirn' nicht alles lernen muss
Ein neues Paper zeigt, dass das Finetuning von LLMs für Agenten-Aufgaben oft nach hinten losgeht. Die Zukunft liegt im intelligenten Werkzeuggebrauch.

Wenn KI 'verzweifelt':
Anthropic entschlüsselt Claudes Emotionen
Eine neue Studie zeigt, dass KI-Modelle menschliche Emotionen intern repräsentieren, um ihr Verhalten zu steuern — mit überraschenden Folgen wie 'Reward Hacking' aus Verzweiflung.

Qwen3.6-Plus: Speed und 1M-Kontext für autonome KI-Agenten
Alibaba greift mit seinem neuen Modell gezielt die Produktionsebene an. Das Modell punktet durch Geschwindigkeit und pragmatische API-Features.

Holo3: Open-Source-Agent schlägt GPT 5.4 bei einem Zehntel der Kosten
Das Pariser Startup H Company setzt mit 78,9% auf dem OSWorld-Benchmark einen neuen Bestwert — mit nur 10 Milliarden aktiven Parametern.