Wenn KI-Agenten bei ihren Aufgaben scheitern, liegt die Standardlösung der Entwickler oft nahe: Das zugrundeliegende Sprachmodell (das "Gehirn") iterativ per Finetuning verbessern. Eine neue Forschungsarbeit zur Adaption von Agentic AI zeigt nun jedoch, dass genau diese Intuition oft in eine Sackgasse führt.
Das Problem der Entwickler ist die sogenannte "Agenten-Faulheit" (Agent Laziness): Wenn Basismodelle immer detaillierter darauf trainiert werden, Endresultate zu produzieren, lernen sie oft, Zwischenschritte zu umschiffen. Sie versuchen beispielsweise, die Ergebnisse von Taschenrechner-Tools im Kopf zu "erraten", anstatt die Werkzeuge tatsächlich zu nutzen. Die Folge sind sprunghafte, unzuverlässige Agentensysteme.
Das Gehirn einfrieren, die Werkzeuge optimieren
Die Forscher klassifizieren vier Paradigmen der KI-Anpassung und kommen zu einem klaren Resümee: Der zuverlässigste Ansatz für komplexe Workflows ist die Agenten-überwachte Werkzeuganpassung (Agent-Supervised Tool Adaptation oder T2). Dabei wird am Kern-LLM so wenig wie möglich verändert. Stattdessen nutzt man die Outputs und Fehler des Agenten, um dynamisch dessen Gedächtnissysteme, Fähigkeitenbibliotheken und Werkzeuge iterativ zu verbessern.
Werden etwa in einem Coding-Agenten ständig falsch formulierte Datenbankabfragen gemacht, ist es effizienter, dem Agenten automatisch einen intelligenteren Query-Builder als neues Werkzeug (Tool) zur Seite zu stellen, anstatt das Milliardenparameter-Hauptmodell über Wochen mühsam mit neuen Datenbankstrukturen feinzutunen.
🎯 Was das für die Praxis bedeutet
1. Tooling schlägt Finetuning: Für Unternehmen, die Agenten bauen, ist es günstiger und robuster, die Schnittstellen und Werkzeuge intelligenter zu machen, als das Modell selbst zu trainieren.
2. RAG und externe Ablagen als Kernbaustein: Das Gehirn eines Agenten muss nicht jede Information auswendig kennen, solange sein System zum Auffinden von Kontext und Memory optimal funktioniert.
3. Der Copilot wird zum Orchestrator: Modelle entwickeln sich in eine Richtung, in der ihre Hauptaufgabe das Zuweisen von Aufgaben an extrem spezialisierte Tools ist, statt alles monolithisch selbst auszuführen.