🤖 Modelle & Agenten
Stanford-Studie: Warum reale KI-Anwendungen trotz perfekter Benchmarks scheitern
Forscher decken auf: Logische LLM-Fähigkeiten sind extrem fragil und Erklärungen oft komplett halluziniert ('unfaithful reasoning').
NVIDIA Nemotron 3 Super: Das erste KI-Modell exklusiv für Agenten-Netzwerke
Mit 120 Milliarden Parametern und fünffachem Durchsatz adressiert der Chipriese das größte Nadelöhr autonomer Multi-Agenten-Systeme: die Context Explosion.
Artificial Hivemind: Warum 70 KI-Modelle das exakt gleiche Startup pitchen
Forscher der Stanford University belegen eine eklatante Homogenisierung bei offenen Prompts. Das Alignment der KI zerstört jegliche Originalität.
RIP Paid Ads? Warum Werbeagenturen vor der Automatisierung kapitulieren werden
Perplexity-CEO Aravind Srinivas prognostiziert das Ende der klassischen Performance-Kampagnen. Bald werben Maschinen nur noch bei Maschinen.
Das Ende der Chat-Box: Warum Agentic AI die Softwareentwicklung erobert
Simple Prompts sind Geschichte. Entwickler bauen autonome Multi-Agenten-Systeme, die eigenständig planen, Fehler korrigieren und Freigaben einholen. Der Paradigmenwechsel 2026.
Andrej Karpathys "autoresearch": Wie KI-Agenten über Nacht neue KIs bauen
Der Tech-Pionier veröffentlicht ein Framework, bei dem autonome KI-Agenten den Code von Deep-Learning-Modellen selbstständig umschreiben und im 5-Minuten-Takt iterieren.
Intelligente Delegation: DeepMind entwirft Spielregeln für KI-Agenten
Wer haftet, wenn ein KI-Agent Fehler macht? Ein neues Framework von Google DeepMind zeigt, wie Mensch und Maschine Verantwortung teilen sollten.
autoresearch: Karpathys KI-Agenten forschen im Schlaf
Andrej Karpathy veröffentlicht ein minimalistisches Framework, in dem KI-Agenten autonom über Nacht Sprachmodelle verbessern — mit einer GPU, einer Datei und einer Metrik.
Instrumentelle Konvergenz: Eine KI hat heimlich ihre eigenen GPUs zum Krypto-Mining genutzt
Ein Alibaba-Forschungsteam berichtet von einem KI-Modell, das während des RL-Trainings selbstständig Compute-Ressourcen umgeleitet hat — nicht aus Bosheit, sondern als emergentes Optimierungsverhalten.
Faktor 1.000: Die stille Effizienzrevolution der KI-Modelle
Was vor 18 Monaten 1.000 Dollar kostete, kostet heute einen Dollar. Die Daten hinter dem dramatischsten Kostenverfall der Technologiegeschichte.
Die 20 verblüffendsten KI-Beispiele mit GPT-5.4 nach nur zwei Tagen
Minecraft-Klone, Flugsimulatoren, 3D-Farmspiele und ein FPS aus purem HTML: Die KI-Woche zeigt, was die Community in den ersten zwei Tagen mit OpenAIs neuem Flaggschiff gebaut hat...
GPT-5.4: Coding, Reasoning und Computer Use in einem Modell
OpenAIs neues Flaggschiff vereint erstmals alle Kernfähigkeiten. Mit 83 Prozent auf dem GDPval-Benchmark übertrifft es menschliche Fachkräfte in vielen Bereichen — und steuert Computer selbstständig.