Modelle & Agenten

Agentic AI: Warum das 'Gehirn' nicht alles lernen muss

Ein neues Paper zeigt, dass das Finetuning von LLMs für Agenten-Aufgaben oft nach hinten losgeht. Die Zukunft liegt im intelligenten Werkzeuggebrauch.

Kai · 03. Apr. 2026 · 2 Min. Lesezeit

Wenn KI-Agenten bei ihren Aufgaben scheitern, liegt die Standardlösung der Entwickler oft nahe: Das zugrundeliegende Sprachmodell (das "Gehirn") iterativ per Finetuning verbessern. Eine neue Forschungsarbeit zur Adaption von Agentic AI zeigt nun jedoch, dass genau diese Intuition oft in eine Sackgasse führt.

Das Problem der Entwickler ist die sogenannte "Agenten-Faulheit" (Agent Laziness): Wenn Basismodelle immer detaillierter darauf trainiert werden, Endresultate zu produzieren, lernen sie oft, Zwischenschritte zu umschiffen. Sie versuchen beispielsweise, die Ergebnisse von Taschenrechner-Tools im Kopf zu "erraten", anstatt die Werkzeuge tatsächlich zu nutzen. Die Folge sind sprunghafte, unzuverlässige Agentensysteme.

Das Gehirn einfrieren, die Werkzeuge optimieren

Die Forscher klassifizieren vier Paradigmen der KI-Anpassung und kommen zu einem klaren Resümee: Der zuverlässigste Ansatz für komplexe Workflows ist die Agenten-überwachte Werkzeuganpassung (Agent-Supervised Tool Adaptation oder T2). Dabei wird am Kern-LLM so wenig wie möglich verändert. Stattdessen nutzt man die Outputs und Fehler des Agenten, um dynamisch dessen Gedächtnissysteme, Fähigkeitenbibliotheken und Werkzeuge iterativ zu verbessern.

Werden etwa in einem Coding-Agenten ständig falsch formulierte Datenbankabfragen gemacht, ist es effizienter, dem Agenten automatisch einen intelligenteren Query-Builder als neues Werkzeug (Tool) zur Seite zu stellen, anstatt das Milliardenparameter-Hauptmodell über Wochen mühsam mit neuen Datenbankstrukturen feinzutunen.

🎯 Was das für die Praxis bedeutet

1. Tooling schlägt Finetuning: Für Unternehmen, die Agenten bauen, ist es günstiger und robuster, die Schnittstellen und Werkzeuge intelligenter zu machen, als das Modell selbst zu trainieren.

2. RAG und externe Ablagen als Kernbaustein: Das Gehirn eines Agenten muss nicht jede Information auswendig kennen, solange sein System zum Auffinden von Kontext und Memory optimal funktioniert.

3. Der Copilot wird zum Orchestrator: Modelle entwickeln sich in eine Richtung, in der ihre Hauptaufgabe das Zuweisen von Aufgaben an extrem spezialisierte Tools ist, statt alles monolithisch selbst auszuführen.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen

ArXiv Paper ↗ @simplifyinAI auf X ↗

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Markus M. Kirchmair

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Agentic AI: Warum das 'Gehirn' nicht alles lernen muss

Das Gehirn einfrieren, die Werkzeuge optimieren

🎯 Was das für die Praxis bedeutet

Die KI Woche als App

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Agentic AI: Warum das 'Gehirn' nicht alles lernen muss

Das Gehirn einfrieren, die Werkzeuge optimieren

🎯 Was das für die Praxis bedeutet

Das könnte Sie auch interessieren

Google führt das KI-Rennen wieder an

Google I/O Vorschau: Gemini Spark soll mit eigenem KI-Agenten Codex und Cowork angreifen

Google I/O 2026: Die nächste Modellwelle rollt an - und sie trifft die Tool-Szene hart

Fehler melden

Die KI Woche als App