Exponentielles Wachstum kennt man. Was gerade bei der KI-Leistungsfähigkeit passiert, geht darüber hinaus: Die METR Time-Horizon-Daten zeigen, dass die jüngsten Modelle die bisherige Exponentialkurve nach oben durchbrechen. Von GPT-5 (September 2025) zu Claude Opus 4.6 (Februar 2026, 16,2 Stunden) — eine Versiebenfachung in fünf Monaten. Das ist nicht mehr exponentiell. Das ist hyperbolisch.
Claude Opus 4.6 hat damit die Benchmark-Ergebnisse gesprengt: Der Time-Horizon für Software-Aufgaben ist von 5 Stunden 20 Minuten (Opus 4.5) auf über 14 Stunden gestiegen. Die KI-Community auf X reagiert mit einer Mischung aus Euphorie und Schock: „Welcome to the singularity.“
Was METR misst — und warum es so wichtig ist
METR (Model Evaluation & Threat Research) misst den sogenannten Time-Horizon: die Aufgabendauer, bei der ein KI-Modell eine 50%ige Erfolgsquote erreicht. Die Aufgaben stammen aus echten Software-Engineering-, ML-Forschungs- und Cybersecurity-Szenarien. Die menschliche Baseline wird von Experten mit durchschnittlich 5 Jahren Berufserfahrung festgelegt.
Die komplette Entwicklung auf einen Blick:
| Modell | Datum | Time-Horizon |
|---|---|---|
| GPT-4 | März 2023 | ~3,4 Minuten |
| GPT-4o | Mai 2024 | ~6 Minuten |
| o1 | Dez 2024 | ~37 Minuten |
| Claude 3.7 Sonnet | März 2025 | 59 Minuten |
| GPT-5 | Sept 2025 | ~2 Stunden 17 Min. |
| Claude Opus 4.5 | Nov 2025 | 5 Stunden 20 Minuten |
| GPT-5.3-Codex | Feb 2026 | ~10–12 Stunden |
| Claude Opus 4.6 | Feb 2026 | ~14,5 bis 16,2 Stunden |
Von exponentiell zu hyperbolisch
Bis März 2025 passte eine exponentielle Trendlinie gut auf die Daten. „We haven't seen any evidence of the exponential growth in time horizon slowing down“, schreibt METR.
Doch genau hier wird es spannend: Die jüngsten Datenpunkte — GPT-5.3-Codex und Claude Opus 4.6 — liegen über der bisherigen Exponentialkurve. Das deutet auf eine Beschleunigung der Beschleunigung hin: hyperbolisches Wachstum. Die Kurve nähert sich einer Singularität — einem Punkt, an dem der Time-Horizon mathematisch gegen unendlich geht. Nicht in Jahrzehnten, sondern potenziell in Monaten oder wenigen Jahren.
Die KI-Community reagiert
Die Reaktionen auf X fallen entsprechend drastisch aus. @scaling01 postete: „Welcome to the singularity. AI is taking off.“ @aidigest_ (AI Digest, gegründet von Eli Lifland, einem der Autoren des vielbeachteten AI 2027-Szenarios) ordnete ein: „The exponential continues“ — und verwies auf die stetige Verdreifachung des Time-Horizons alle paar Monate.
@kimmonismus fasste zusammen, was in den Frontier-Labs offenbar passiert: „AGI very close. Superintelligence also not far off.“ Die internen Modelle würden sich noch schneller verbessern als die veröffentlichten Versionen — ein Muster, das auch OpenAI und Google DeepMind bestätigen.
Auch Anthropics Claude dominiert bei Tool-Nutzung
Ein weiterer Datenpunkt, den Anthropic selbst veröffentlichte: Software Engineering macht rund 50% aller agentischen Tool-Aufrufe bei Claude aus. Die Frage, die @kimmonismus stellte: „The most important question is: which domain will Claude dominate next?“ — ist berechtigt. Wenn ein KI-Modell bereits die Hälfte seiner agentischen Kapazität in Software-Entwicklung investiert und dabei exponentiell besser wird, werden andere Domänen folgen.
Was das praktisch bedeutet
Ein Time-Horizon von 16 Stunden bedeutet: Claude Opus 4.6 löst Aufgaben, die einem erfahrenen Entwickler zwei volle Arbeitstage kosten würden — mit 50% Erfolgsquote. Wenn der aktuelle Trend anhält:
- Mitte 2026: Time-Horizons von mehreren Tagen — komplette Feature-Entwicklung und Projektarbeit
- Ende 2026: Time-Horizons von Wochen — ganze Sprint-Zyklen autonom bewältigbar
- 2027: Funktionale Autonomie für die meisten Software-Projekte
📊 Einordnung
Die mathematische Frage „exponentiell oder hyperbolisch?“ ist nicht akademisch — sie entscheidet über den Zeitplan. Exponentielles Wachstum gibt uns noch Jahre. Hyperbolisches Wachstum bedeutet: Der Übergang von „KI als Assistent“ zu „KI als autonomer Akteur“ könnte in Monaten stattfinden, nicht Jahren. Das Bemerkenswerte: Selbst METR — traditionell konservativ in ihren Einschätzungen — findet keinerlei Anzeichen für eine Verlangsamung. Die Trendlinie zeigt nur in eine Richtung: steil nach oben, und zunehmend steiler.
🎯 Was bedeutet das konkret?
- Entwickler-Teams: KI-Agenten wie Claude Opus 4.6 können bereits jetzt als autonome Teammitglieder für komplexere Aufgaben eingesetzt werden. Wer das nicht testet, verliert den Anschluss.
- Unternehmen: Die Kosten für Software-Entwicklung werden in den nächsten 12 Monaten drastisch sinken. Budgets und Teamgrößen sollten jetzt strategisch überprüft werden.
- Arbeitnehmer: Software-Entwickler, die ausschließlich auf manuelle Coding-Skills setzen, müssen sich umorientieren — hin zu Architektur, Review und KI-Orchestrierung.