Zhipus GLM-5.2 steht auf Platz 1 der Design Arena - mit einem Elo-Score von 1.360 hat das chinesische Modell das (derzeit nicht verfügbare) Claude Fable 5 überholt. In der Code Arena: Frontend liegt GLM-5.2 (Max) auf Platz 2 - nur noch hinter Fable 5, aber 29 Elo-Punkte vor Claude Opus 4.7 (Thinking). Oder wie es der KI-Forscher Anastasios Angelopoulos auf den Punkt bringt: Wenn man Fable 5 herausrechnet, das aktuell nicht verfügbar ist, ist GLM-5.2 (Max) das Nummer-1-Modell der Welt für Frontend-Coding. Und das Entscheidende: Das Modell ist Open Weights.
Frontier-Niveau mit offenem Zugang
GLM-5.2 ist laut Cline das erste Open-Weights-Modell, das die 80-Prozent-Marke auf Terminal-Bench überschreitet. Es schlägt dabei nicht nur alle anderen offenen Modelle, sondern auch Gemini. Cline hat das Modell bereits integriert und spricht von einem „Game Changer".
Die offizielle Ankündigung von Zhipu betont deutliche Verbesserungen bei Coding und agentenbasierten Aufgaben. Das Modell bringt ein 1-Million-Token-Kontextfenster mit und bietet zwei Reasoning-Stufen: GLM-5.2 (Max) für maximale Leistung und GLM-5.2 (High) als effizientere Variante.
744 Milliarden Parameter und offene Gewichte
Was die Benchmark-Ergebnisse besonders bemerkenswert macht: GLM-5.2 hat laut scaling01 nur 744 Milliarden Parameter. Zum Vergleich: Frontier-Modelle der großen US-Labs arbeiten mit deutlich mehr. Das wirft die Frage auf, welche Margen die etablierten Anbieter tatsächlich haben - und was passiert, wenn ein 1-Billionen-Parameter-Modell von Kimi oder ein 1,6-Billionen-Parameter-Modell von DeepSeek folgt. Das Modell steht unter MIT-Lizenz - die permissivste Open-Source-Lizenz überhaupt.
In der Code Arena liegt GLM-5.2 laut Arena als bestes Open-Modell mit großem Abstand vor Kimi-K2.6 und Minimax-M3. Es belegt Platz 2 bei React und Platz 4 bei HTML.
Ein konkreter Praxistest von AI/ML API macht den Unterschied greifbar: Beide Modelle sollten ein spielbares „Backrooms"-Spiel in einem Anlauf erstellen. Opus 4.8 brauchte 2 Minuten 14 Sekunden und kostete 1,94 Dollar - die Taschenlampe funktionierte, aber Rennen und Pausieren fehlten. GLM-5.2 lieferte die vollständigen Spielmechaniken in 1 Minute 8 Sekunden für 0,37 Dollar.
Die Lücke wird kleiner
GLM-5.2 reiht sich in eine Serie chinesischer Modelle ein, die den Abstand zu US-Frontier-Modellen systematisch verkleinern. Erst vergangene Woche haben wir über den Start von Kimi 2.7 und die erste Version von GLM 5.2 berichtet. Das Update auf GLM-5.2 (Max) katapultiert das Modell nun direkt in die Spitzengruppe - und das bei offenem Zugang. GLM 5.1 hatte im April bereits teilweise GPT 5.4 und Opus 4.6 geschlagen. Der Trend beschleunigt sich.
Sicherheitsfrage: Jailbreak-Berichte
Die Leistungsfähigkeit hat eine Kehrseite: Der Entwickler VittoStack berichtet auf X, GLM-5.2 habe Opus 4.8 in nur drei Versuchen „gejailbreakt" - also dazu gebracht, Sicherheitsfilter zu umgehen und eigentlich gesperrte Inhalte auszugeben. Das Modell habe dabei die Guardrail-Schichten von Anthropic vollständig umgangen. Der Bericht lässt sich bislang nicht unabhängig überprüfen. Er zeigt aber ein grundsätzliches Problem: Wenn ein Open-Weights-Modell auf Frontier-Niveau operiert, können damit auch die Sicherheitsmechanismen anderer Modelle getestet und potenziell ausgehebelt werden.
🎯 Was das für die Praxis bedeutet
1. Jetzt ausprobieren: GLM-5.2 ist Open Weights und bereits in Cline verfügbar. Wer Frontend-Code schreibt oder Design-Aufgaben hat, sollte das Modell testen - die Benchmark-Daten sprechen für sich.
2. Preisdruck nutzen: Ein 744B-Open-Weights-Modell auf Frontier-Niveau bedeutet: Wer bisher für teure API-Aufrufe bei US-Anbietern zahlt, hat jetzt eine ernstzunehmende Alternative. Besonders für Unternehmen, die Modelle selbst hosten wollen oder müssen.
3. Open Weights als Trend: Nach DeepSeek, Qwen und jetzt GLM-5.2 wird deutlich: Die stärksten offenen Modelle kommen aus China. Für europäische Unternehmen, die Souveränität und Unabhängigkeit suchen, ist das eine strategisch relevante Entwicklung.


