Software wird nicht mehr geschrieben - sie wird beauftragt. Was nach einer steilen These klingt, hat der Forscher Zhenfeng Cao in einem neuen Paper auf arXiv systematisch durchargumentiert. Sein Kernargument: KI-Agenten verbessern Software nicht, sie ersetzen das gesamte Konzept. Code ist in dieser Zukunft kein handwerkliches Produkt mehr, sondern eine flüchtige Ressource - generiert, ausgeführt, verworfen.

Der Agent ist die Software

Die klassische Kette lautet: Ein Mensch schreibt Code, der Code wird zu Software, die Software liefert ein Ergebnis. Caos Paper beschreibt einen anderen Ablauf: Ein Agent erhält eine Absicht und erzeugt das Ergebnis direkt. Code entsteht dabei zwar noch, aber als Wegwerfprodukt im Hintergrund - nicht als Artefakt, das gepflegt und versioniert wird.

Das ist mehr als ein technisches Detail. Wenn Code seinen Status als dauerhaftes Werkstück verliert, verändert sich die gesamte Wertschöpfungskette. Der Entwickler wird zum "Intent Architect" - jemand, der präzise beschreibt, was erreicht werden soll, statt Zeile für Zeile festzulegen, wie es geschehen soll. Ein Trend, der sich bereits bei Projekten wie dem GTA-Klon aus einem einzigen Prompt abzeichnet.

Drei Argumente für die Unvermeidlichkeit

Cao stützt seine These auf drei Säulen:

  • Komplexitätsskalierung: Moderne Softwaresysteme sind so komplex geworden, dass menschliche Programmierer die Skalierung alleine nicht mehr stemmen können. Agenten sind laut dem Paper keine Option, sondern eine logische Konsequenz.
  • Neudefinition statt Ablösung: Software verschwindet nicht - ihr Charakter ändert sich. Statt eines statischen Produkts wird sie zum dynamischen Zwischenprodukt eines Agenten.
  • Eine neue Disziplin: Aus der Notwendigkeit, Agenten zu orchestrieren, entsteht ein eigenes Fachgebiet - Agentic Engineering. Nicht Programmieren, sondern das Koordinieren autonomer Systeme wird zur Kernkompetenz.

Die Benchmark-Realität bremst die Vision

Trotz der großen Erzählung liefert Cao auch ernüchternde Zahlen. Auf dem SWE-bench Verified - einem Benchmark, der reale Software-Engineering-Aufgaben testet - lösen die besten Modelle gerade einmal ein Drittel der Aufgaben: Lingma 72B erreicht 30,2 Prozent, GPT-4o kommt auf 31,8 Prozent.

Noch deutlicher wird die Lücke beim EvoClaw-Benchmark: Isolierte Einzelaufgaben schaffen Agenten mit über 80 Prozent Erfolgsrate. Sobald die Aufgaben aber aufeinander aufbauen und der Agent über längere Zeit den Kontext halten muss, fällt die Quote auf unter 38 Prozent. Das zeigt: Für isolierte Sprints taugen Agenten schon heute. Für die ausdauernde, kontextabhängige Arbeit, die echte Softwareprojekte ausmacht, fehlt noch ein Stück.

Lichtblicke gibt es bei der Teamarbeit zwischen Agenten. Eine Pilotstudie von LangChain berichtet von 93 Prozent schnellerer Fehlersuche (Root-Cause-Analyse), wenn mehrere spezialisierte Agenten koordiniert zusammenarbeiten. Genau diesen Ansatz verfolgen bereits Tools wie Microsofts Scout, der als "Always-on"-Agent dauerhaft im Hintergrund agiert.

Vom Lizenzmodell zu Agent-as-a-Service

Das Paper zeichnet einen historischen Bogen über drei Software-Epochen. Erst kam die klassische Lizenzsoftware - gekauft, installiert, lokal betrieben. Dann folgte SaaS (Software-as-a-Service) - die Verlagerung in die Cloud, bezahlt per Abo. Jetzt steht laut Cao die dritte Welle an: Agent-as-a-Service (AaaS). Hier kauft man weder Software noch Zugang zu einer Plattform, sondern die Fähigkeit eines Agenten, eine Aufgabe zu erledigen.

Als konkretes Beispiel nennt das Paper den Hermes Agent von Nous Research mit 179.000 GitHub-Stars. Hermes kann sich über sogenanntes "Skill-Patching" selbst neue Fähigkeiten aneignen - ein Mechanismus, der bereits in der Desktop-Version als persistentes Gedächtnis umgesetzt wird. Agenten, die mit ihren Aufgaben wachsen, statt bei jedem Neustart von Null zu beginnen.

Die Vier-Stufen-Roadmap

Cao schlägt eine Roadmap vor, die den Übergang in vier Phasen gliedert:

  • 2023 bis 2025 - Tool-Augmented: KI als Copilot in bestehenden Entwicklungsumgebungen. Code-Vervollständigung, Vorschläge, Fehlererkennung. Diese Phase ist bereits Realität.
  • 2025 bis 2027 - Single-Task Autonomous: Einzelne Agenten lösen komplette Aufgaben selbstständig, vom Bug-Fix bis zum Feature.
  • 2026 bis 2029 - Multi-Agent Teams: Koordinierte Agenten-Teams bearbeiten komplexe Projekte. Spezialisierte Agenten für Testing, Architektur und Deployment arbeiten parallel.
  • Ab 2028 - Self-Evolving Ecosystems: Agenten-Ökosysteme, die sich autonom weiterentwickeln und optimieren. Modelle wie Claude Mythos zeigen bereits, welche Leistungsfähigkeit die nächste Generation mitbringt - und welche Sicherheitsfragen das aufwirft.

Was an der These fehlt

Caos Paper ist in erster Linie eine konzeptuelle Arbeit - eine Landkarte, kein Beweis. Die Benchmark-Daten stammen aus bestehender Literatur, nicht aus eigenen Experimenten. Die 93-Prozent-Zahl zur schnelleren Fehlersuche beruht auf einer einzelnen Pilotstudie. Und die Roadmap ist eine Projektion, keine empirisch gestützte Vorhersage.

Trotzdem leistet das Paper einen wichtigen Beitrag: Es bündelt verstreute Beobachtungen zu einer kohärenten These und gibt dem Wandel, den viele Entwickler bereits spüren, einen begrifflichen Rahmen. Die Frage ist nicht mehr, ob Agenten Software verändern - sondern wie schnell und wie tiefgreifend.

🎯 Was das für die Praxis bedeutet

1. Prompt-Kompetenz wird zur Schlüsselqualifikation: Wer lernt, Absichten präzise zu formulieren statt Code zu schreiben, positioniert sich für die nächste Phase der Softwareentwicklung.

2. Agenten-Workflows jetzt testen: Die EvoClaw-Daten zeigen klar - isolierte Aufgaben funktionieren bereits zuverlässig. Teams sollten mit begrenzten, klar definierten Automatisierungen starten, bevor sie ganze Projekte delegieren.

3. Architektur-Denken statt Code-Denken: Die Rolle des Entwicklers verschiebt sich in Richtung Systemdesign und Agentenorchestrierung. Weiterbildung in Multi-Agent-Koordination wird wichtiger als die nächste Programmiersprache.

📰 Quellen
Zhenfeng Cao auf arXiv ↗
Teilen: