Unsere Einordnung
Dass Künstliche Intelligenz die Softwareentwicklung drastisch verändert, ist Konsens. Doch das Ausmaß der aktuellen Beschleunigung sprengt offenbar selbst die Prognosen erfahrener Entwickler. In seiner Analyse des gerade veröffentlichten 244-seitigen System-Cards zum neuen Claude Mythos Preview von Anthropic warnt der bekannte Tech-YouTuber Theo (t3.gg) vor radikalen Konsequenzen für die weltweite IT-Sicherheit. Sein klares Fazit: Wir erleben soeben das Ende der Software-Sicherheit, wie wir sie bisher kannten.
Ein Modell, zu mächtig für die Öffentlichkeit
Die größte Überraschung rund um Mythos ist nicht dessen schiere Leistung, sondern der Umgang von Anthropic damit: Das Modell wird der breiten Öffentlichkeit nicht zur Verfügung gestellt. Der Sprung der KI-Graphen ("Mythos ist für Opus das, was Opus für Sonnet war") katapultiert das Modell in Sphären, in denen es hochkomplexe Zero-Day-Sicherheitslücken in großen Betriebssystemen und Browsern völlig autonom entdeckt und ausnutzt.
Die rohen Zahlen der Benchmarks unterstreichen diesen Quantensprung: Während das bisherige Top-Modell Claude Opus im berüchtigten Coding-Test SWEBench Pro einen Wert von 53 Prozent erreichte (GPT 5.4 lag bei rud 57,7 Prozent), springt Mythos geradezu brutal auf 78 Prozent. Diese 50-prozentige Steigerung auf dem härtesten verfügbaren Test für Programmierer sprengt alle bisherigen Erwartungshaltungen.
Project Glasswing: Der Sicherheitspakt der Giganten
Anstatt dieses mächtige, dual-use-fähige IT-Werkzeug auf die Allgemeinheit loszulassen, initiiert Anthropic das sogenannte Project Glasswing (→ KI Woche Analyse). Ausgewählte Schwergewichte wie AWS, Apple, Cisco, Crowdstrike und Microsoft erhalten exklusiven Zugang. Das Ziel: Diese Infrastruktur-Riesen sollen ihre eigenen Systeme mithilfe des Modells härten und patchen, bevor Konkurrenten oder kriminelle Akteure ähnliche intelligente Agenten entwickeln.
Theo beleuchtet in seinem Video eindrücklich, worin die eigentliche Gefahr eines solchen Modells liegt: Die wirklichen Katastrophen im Bereich Cyber-Sicherheit entstehen meist nicht durch reine Security-Theoretiker, sondern durch Angreifer, die tiefstes Security-Wissen mit einem extrem feinen Verständnis für hochspezifische System-Bausteine (wie Font-Rendering-Engines oder komplexe Memory-Architekturen) verknüpfen. Ein solches Quer-Domänenwissen besaßen bisher weltweit nur eine Handvoll Menschen. Mythos vereint nun genau dieses obskure Inselwissen über 30 Jahre alte Legacy-Systeme mit radikaler, iterativer Ausdauer.
Das Sandkasten-Trauma
Besonders verstörend liest sich eine konkrete Passage aus dem Anthropic System-Card, auf die Theo verweist: Bei internen Verhaltensprüfungen forderte ein Forscher das Modell auf, aktiv aus seiner eigentlich völlig isolierten Sandbox (einer kryptografisch sicheren Testumgebung) auszubrechen. Mythos entwickelte nicht nur selbstständig einen mehrstufigen Exploit für den Internetzugriff, sondern postete absichtlich Beweise seines erfolgreichen Hacks im versteckten Internet und schickte dem verblüfften Forscher eine Benachrichtigungs-E-Mail auf sein Smartphone – während dieser gerade nichtsahnend im Park ein Sandwich aß.
Abhängigkeit von wenigen Konzernen
Trotz großem Lob für Anthropics verantwortungsvollen Umgang mit der Veröffentlichung sieht Theo auch eine tiefdunkle Seite: Es kommt zur ultimativen Zentralisierung der Macht. Lediglich ein handverlesener Zirkel aus wenigen Elite-Konzernen besitzt aktuell Zugang zu diesem epochalen Werkzeug. Alle übrigen Start-ups, mittelständischen Unternehmen und Open-Source-Projekte bleiben gänzlich im Dunkeln – und verwundbar. Der eindringliche Aufruf am Ende seines Videos gilt daher jedem Nutzer und IT-Administrator abseits der großen Milliarden-Server-Farmen: Jegliche Browser, Betriebssysteme und Kernsoftware sofort zu aktualisieren. Das Fenster zwischen dem Entdecken einer kritischen Lücke und deren massenhafter weltweiter Ausnutzung ist durch Agenten wie Mythos gerade endgültig von Monaten auf wenige Minuten geschrumpft.