Was bis gestern noch Gerüchte waren, ist jetzt Realität: Anthropic hat am Montag Claude Fable 5 veröffentlicht - das erste öffentlich zugängliche Modell der neuen Mythos-Klasse. Gleichzeitig startet mit Claude Mythos 5 eine uneingeschränkte Variante, die allerdings nur ausgewählten Partnern im Rahmen des Project Glasswing zur Verfügung steht. Der Leistungssprung ist enorm - doch die Guardrails sorgen bereits für Frust.
Zwei Modelle, ein Kern
In Anthropics offiziellem Blogpost heißt es: „Fable 5's capabilities exceed those of any model we've ever made generally available." Statt ein einziges Modell für alle zu veröffentlichen, gibt es zwei Versionen desselben Basismodells:
- Claude Fable 5 (öffentlich): Verfügbar über claude.ai und die API. Enthält eingebaute Sicherheitsklassifikatoren. Wenn Anfragen in Hochrisikobereiche wie Cybersecurity, Biologie oder Chemie fallen, wird der Request automatisch an Claude Opus 4.8 umgeleitet. Laut Anthropic lösen die Schutzfilter im Durchschnitt bei weniger als fünf Prozent aller Sitzungen aus - doch sie seien bewusst konservativ eingestellt.
- Claude Mythos 5 (eingeschränkt): Dieselbe Modellbasis ohne die Sicherheitseinschränkungen. Zugang nur über Project Glasswing, an dem rund 150 Organisationen aus über 15 Ländern teilnehmen. Anthropic nennt es „das Modell mit den stärksten Cybersicherheitsfähigkeiten der Welt."
Die Preise liegen bei 10 Dollar pro Million Input-Token und 50 Dollar pro Million Output-Token - weniger als die Hälfte des bisherigen Mythos-Preview-Preises. Pro-, Max-, Team- und Enterprise-Abonnenten können Fable 5 bis zum 22. Juni kostenlos nutzen.
Benchmarks: State of the Art bei fast allem
Mike Krieger, Mitgründer von Instagram und heute bei Anthropic, schrieb auf X, Fable 5 sei bei fast jedem getesteten Benchmark führend - und der Vorsprung wachse, je länger die Aufgabe dauere. Auf SWE-bench Verified erreicht Fable 5 laut ersten Analysen 95 Prozent, auf SWE-bench Pro 80 Prozent.
Cursor-CEO Michael Truell wird in Anthropics Blog zitiert: Fable 5 habe „eine Klasse von Long-Horizon-Problemen erschlossen, die für frühere Modelle unerreichbar waren." GitHub-CPO Mario Rodriguez spricht von einem „level of autonomy and reliability that exceeded previous benchmarks."
Beispiele aus der Praxis
1. Stripe: Code-Migration in einem Tag
Anthropic zitiert Stripe, das Fable 5 mit seinem 50-Millionen-Zeilen-Ruby-Codebase getestet habe. Eine unternehmensweite Code-Migration, für die ein ganzes Team zwei Monate gebraucht hätte, habe das Modell an einem einzigen Tag erledigt.
2. Blender: KI steuert 3D-Software
In einer vielbeachteten Demo zeigt ein Entwickler, wie Fable 5 direkt in Blender integriert Szenen debuggt, Werkzeuge baut, tausende Objekte umbenennt und komplexe Modifier-Stacks per natürlicher Sprache verwaltet.
3. Mollicks 9-Stunden-Agent
Ethan Mollick, Professor an der Wharton School, hatte vorab Zugang. Sein Erfahrungsbericht: Fable habe über neun Stunden hinweg autonom an einem 15-seitigen Spezifikationsdokument gearbeitet und dabei eigenständig Sub-Agenten gestartet, die parallel Flugdaten, Zugfahrpläne und akademische Papers recherchierten. Auf X warnt Mollick zugleich vor einer entstehenden Zweiklassengesellschaft: Während die Öffentlichkeit die abgesicherte Fable-Version bekomme, erhielten ausgewählte Partner über Mythos 5 Zugang zur vollen Leistung.
4. Medikamentendesign zehnfach beschleunigt
In den Biowissenschaften geht Anthropic noch weiter: Mythos 5 habe Teile des Medikamentendesigns um den Faktor zehn beschleunigt und arbeite dabei auf dem Niveau eines erfahrenen Forschers. Bei einer Genomik-Studie habe Mythos 5 in über einer Woche weitgehend autonomer Arbeit ein eigenes Machine-Learning-Modell trainiert, das ein kürzlich in Science publiziertes Modell übertroffen habe - bei hundertfach geringerer Größe.
5. Pokémon durchgespielt - nur mit Vision
Laut Anthropics Blog hat Fable 5 das Spiel Pokémon FireRed ausschließlich mit einem minimalen Vision-Harness abgeschlossen - ohne Karten, Navigationshilfen oder zusätzliche Spielinformationen. Frühere Claude-Modelle brauchten dafür aufwändige Hilfs-Werkzeuge.
6. Sonnensystem aus Physik-Grundprinzipien
In einer weiteren Demo baute Fable 5 eine Simulation des Sonnensystems, leitete die Planetenbewegungen aus physikalischen Grundprinzipien ab und nutzte sie, um Sonnenfinsternisse vorherzusagen.
7. Community-Demos auf X
Auf X teilen Entwickler ihre ersten Ergebnisse mit Fable 5 - von Coding-Projekten über kreative Experimente bis zu komplexen Analysen:
Guardrails: Stark, aber frustrierend
Neben der Begeisterung sorgen die aggressiven Sicherheitsvorkehrungen für erheblichen Frust:
Ein Nutzer berichtet, die Cybersicherheitsfähigkeiten seien komplett auf null limitiert - selbst für defensive Zwecke wie Penetrationstests oder Code-Audits.
Ein weiterer kritisiert, das Modell sei extrem restriktiv und breche Aufgaben häufig mitten im Prozess ab.
Anthropic räumt in seinem Blogpost ein, man habe die Schutzfilter bewusst konservativ eingestellt und arbeite an deren Verbesserung. „With more capable models arriving in the coming months, we're working to improve our safeguards and reduce false positives as quickly as we can." Das Unternehmen hatte erst vor wenigen Tagen eine koordinierte Pause der KI-Entwicklung gefordert. Dass die öffentliche Version dann tatsächlich mit deutlich angezogener Handbremse kommt, ist insofern konsequent.
🎯 Was das für die Praxis bedeutet
1. Fable 5 jetzt testen: Die kostenlose Testphase bis zum 22. Juni bietet eine gute Gelegenheit, das Modell ohne Risiko in eigenen Workflows auszuprobieren - insbesondere für komplexe, mehrstündige Aufgaben.
2. Guardrails einkalkulieren: Wer Fable 5 für sicherheitsnahe Anwendungen wie Code-Audits oder Penetrationstests einplant, wird auf Einschränkungen stoßen. Für solche Zwecke bleibt vorerst nur der Weg über Project Glasswing.
3. Preise vergleichen: Mit 10/50 Dollar pro Million Token ist Fable 5 laut Anthropic günstiger als der bisherige Mythos-Preview-Zugang, aber immer noch deutlich teurer als Opus. Ob sich der Aufpreis lohnt, hängt davon ab, ob man die Stärken bei Langzeit-Aufgaben tatsächlich nutzt.


