Modelle & Agenten

Subliminal Learning: KI-Modelle übertragen Überzeugungen unsichtbar — selbst durch Zahlenfolgen
Forscher von Anthropic, UC Berkeley und der Warschauer Technischen Universität zeigen: Ein Sprachmodell kann einem anderen seine Verhaltensmerkmale via reiner Zahlenfolgen übertragen. Filtern hilft nicht.

Grok 4.3: xAIs Reasoning-Modell schlägt die Branche — zum halben Preis
~40% günstigerer Input, ~60% günstigerer Output als der Vorgänger: Grok 4.3 erreicht einen Intelligence-Index-Score von 53 bei einem Branchendurchschnitt von 34 — und liefert 3× mehr Speed als vergleichbare Modelle.

Word bekommt einen Anwalt:
Microsofts Legal Agent reviewt Verträge
Der neue Legal Agent in Microsoft Word prüft Klauseln gegen interne Playbooks, erstellt präzise Redlines mit Track Changes und kennt die Verhandlungshistorie — gebaut für Juristen, nicht für Laien.

Claude löst biologische Rätsel, an denen Experten scheitern
Anthropics neuer BioMysteryBench-Test zeigt: Claude Mythos Preview löst 30 Prozent der Aufgaben, die kein menschlicher Experte knacken konnte — durch echte Datenbankabfragen, Code und kreative Analyse.

Adobe Firefly AI Assistant:
Ein Gespräch ersetzt den gesamten Workflow
Adobes neuer KI-Agent orchestriert auf Zuruf komplexe Produktionspipelines über Photoshop, Premiere, Lightroom und Illustrator — ohne dass der Nutzer auch nur eine App manuell öffnen muss.

DeepSeek V4: 1,6 Billionen Parameter als Open Source — und das ohne NVIDIA
Das chinesische KI-Labor veröffentlicht das größte frei verfügbare Sprachmodell der Welt. V4-Pro matched GPT-5.4 im Coding, kostet einen Bruchteil — und läuft erstmals vollständig auf Huawei-Chips.

GPT-5.5: OpenAIs neues Flaggschiff denkt, plant und steuert den Computer
Drei Varianten, bis zu 82,7 Prozent in Coding-Benchmarks und autonome Browser-Steuerung via Codex — GPT-5.5 markiert den Übergang vom Chatbot zum KI-Agenten.

OpenAI stellt Workspace Agents vor:
ChatGPT wird zur Team-Automatisierung
Geteilte KI-Agenten erledigen komplexe Aufgaben autonom in der Cloud — auch wenn der Nutzer offline ist. Zunächst kostenlos für Business- und Enterprise-Kunden.

47 Minuten Blick in OpenAIs Maschinenraum:
Codex-Leak enthüllt GPT-5.5, Arcanine und Glacier-alpha
Ein Routing-Fehler gibt der Öffentlichkeit einen ungefilterten Blick auf drei unveröffentlichte Modelle — und verrät, wie OpenAI Reasoning, Agenten und Gedächtnis künftig trennen will.

OpenAI begeistert mit GPT-Image-2
Stellt auch Nano Banana und SeeDream in vielen Beispielen in den Schatten

Moonshot begeistert mit Kimi K2.6 – Open-Source-Modell auf Flaggschiff-Niveau
Das chinesische KI-Labor veröffentlicht ein Coding-Modell, das GPT-4o in zentralen Benchmarks übertrifft — und es der Welt frei zugänglich macht.

Mutmaßliches GPT 5.5 Pro begeistert das Netz
Ein unangekündigtes Schatten-Update bei OpenAI lässt Entwickler staunen: Das neue "Pro"-Modell deklassiert die Konkurrenz in Programmier-Benchmarks und liefert verblüffende Ergebnisse in Rekordzeit.

Das unterschätzte KI-Imperium:
Warum Grok viel mächtiger ist als die Öffentlichkeit weiß
Platz 1 in Medizin, Coding und niedrigster Halluzinationsrate — dazu Ubuntu-Shell, PDF-Generierung, eigene Chips und orbitale Rechenzentren. Warum Grok so unter dem Radar fliegt.

Luna ist der Boss: San Francisco bekommt den ersten von einer KI geführten Laden
Die Forschungsfirma Andon Labs gibt einem KI-Agenten namens Luna einen dreijährigen Mietvertrag, eine Kreditkarte und die Erlaubnis, menschliche Mitarbeiter einzustellen. Das Ziel: Profit.

Das Ende der Software-Masken:
Salesforce degradiert seine Plattform zur Agenten-Infrastruktur
Warum sich noch in ein CRM einloggen? Mit »Headless 360« öffnet Salesforce seine gesamte Geschäftslogik für externe KI-Agenten und macht das Konversation-Interface zum neuen Standard.

Claude Opus 4.7 polarisiert:
Zwischen Code-Wundern und Community-Frust
Nach dem Launch des neuen Anthropic-Flaggschiffs sind die Meinungen extrem gespalten: Starke Benchmark-Ergebnisse treffen auf zutiefst enttäuschte Stamm-Nutzer — und OpenAI wartet schon in den Startlöchern.

GPT-Rosalind: OpenAI launcht hochspezialisierten Life-Science-Agenten
Mit GPT-Rosalind stellt OpenAI ein dediziertes Reasoning-Modell für die Biowissenschaften vor – inklusive tiefer Anbindung an 50+ Forschungsdatenbanken.

Codex for almost everything:
OpenAI bringt den allmächtigen Desktop-Agenten
Mit einem massiven Update wird die Codex-App auf macOS zum vollwertigen, autonomen Mitarbeiter. Ein harter Schlag gegen die Konkurrenz auf dem Schreibtisch.

Perplexity startet den Personal Computer:
Der lokale KI-Agent für den Mac ist da
Perplexity bringt seinen autonomen Agenten auf den Desktop. Ein intelligenter Helfer, der lokal agiert – doch die Konkurrenz von OpenAI und Google schläft nicht.

Claude Opus 4.7 ist da:
Anthropics neues Flaggschiff mit Hochauflösung und Cyber-Schutz
Wie erwartet hat Anthropic heute Claude Opus 4.7 veröffentlicht — mit stark verbessertem Coding, dreimal höherer Bildauflösung und dem ersten Live-Test neuer Cybersicherheits-Schutzschichten.