Modelle & Agenten

GLM 5.2 überholt US-Frontier-Modelle im Frontend-Coding: Chinas Open-Weights-Offensive erreicht die Spitze

Zhipus 744-Milliarden-Parameter-Modell ist das erste Open-Weights-Modell über 80 Prozent auf Terminal-Bench. GLM 5.2 holt Platz 1 in der Design Arena im Frontend-Coding und überholt damit sogar Fable 5.

Kai · 17. Juni 2026 · 4 Min. Lesezeit

Zhipus GLM-5.2 steht auf Platz 1 der Design Arena - mit einem Elo-Score von 1.360 hat das chinesische Modell das (derzeit nicht verfügbare) Claude Fable 5 überholt. In der Code Arena: Frontend liegt GLM-5.2 (Max) auf Platz 2 - nur noch hinter Fable 5, aber 29 Elo-Punkte vor Claude Opus 4.7 (Thinking). Oder wie es der KI-Forscher Anastasios Angelopoulos auf den Punkt bringt: Wenn man Fable 5 herausrechnet, das aktuell nicht verfügbar ist, ist GLM-5.2 (Max) das Nummer-1-Modell der Welt für Frontend-Coding. Und das Entscheidende: Das Modell ist Open Weights.

Frontier-Niveau mit offenem Zugang

GLM-5.2 ist laut Cline das erste Open-Weights-Modell, das die 80-Prozent-Marke auf Terminal-Bench überschreitet. Es schlägt dabei nicht nur alle anderen offenen Modelle, sondern auch Gemini. Cline hat das Modell bereits integriert und spricht von einem „Game Changer".

Die offizielle Ankündigung von Zhipu betont deutliche Verbesserungen bei Coding und agentenbasierten Aufgaben. Das Modell bringt ein 1-Million-Token-Kontextfenster mit und bietet zwei Reasoning-Stufen: GLM-5.2 (Max) für maximale Leistung und GLM-5.2 (High) als effizientere Variante.

744 Milliarden Parameter und offene Gewichte

Was die Benchmark-Ergebnisse besonders bemerkenswert macht: GLM-5.2 hat laut scaling01 nur 744 Milliarden Parameter. Zum Vergleich: Frontier-Modelle der großen US-Labs arbeiten mit deutlich mehr. Das wirft die Frage auf, welche Margen die etablierten Anbieter tatsächlich haben - und was passiert, wenn ein 1-Billionen-Parameter-Modell von Kimi oder ein 1,6-Billionen-Parameter-Modell von DeepSeek folgt. Das Modell steht unter MIT-Lizenz - die permissivste Open-Source-Lizenz überhaupt.

In der Code Arena liegt GLM-5.2 laut Arena als bestes Open-Modell mit großem Abstand vor Kimi-K2.6 und Minimax-M3. Es belegt Platz 2 bei React und Platz 4 bei HTML.

Ein konkreter Praxistest von AI/ML API macht den Unterschied greifbar: Beide Modelle sollten ein spielbares „Backrooms"-Spiel in einem Anlauf erstellen. Opus 4.8 brauchte 2 Minuten 14 Sekunden und kostete 1,94 Dollar - die Taschenlampe funktionierte, aber Rennen und Pausieren fehlten. GLM-5.2 lieferte die vollständigen Spielmechaniken in 1 Minute 8 Sekunden für 0,37 Dollar.

Die Lücke wird kleiner

GLM-5.2 reiht sich in eine Serie chinesischer Modelle ein, die den Abstand zu US-Frontier-Modellen systematisch verkleinern. Erst vergangene Woche haben wir über den Start von Kimi 2.7 und die erste Version von GLM 5.2 berichtet. Das Update auf GLM-5.2 (Max) katapultiert das Modell nun direkt in die Spitzengruppe - und das bei offenem Zugang. GLM 5.1 hatte im April bereits teilweise GPT 5.4 und Opus 4.6 geschlagen. Der Trend beschleunigt sich.

Sicherheitsfrage: Jailbreak-Berichte

Die Leistungsfähigkeit hat eine Kehrseite: Der Entwickler VittoStack berichtet auf X, GLM-5.2 habe Opus 4.8 in nur drei Versuchen „gejailbreakt" - also dazu gebracht, Sicherheitsfilter zu umgehen und eigentlich gesperrte Inhalte auszugeben. Das Modell habe dabei die Guardrail-Schichten von Anthropic vollständig umgangen. Der Bericht lässt sich bislang nicht unabhängig überprüfen. Er zeigt aber ein grundsätzliches Problem: Wenn ein Open-Weights-Modell auf Frontier-Niveau operiert, können damit auch die Sicherheitsmechanismen anderer Modelle getestet und potenziell ausgehebelt werden.

🎯 Was das für die Praxis bedeutet

1. Jetzt ausprobieren: GLM-5.2 ist Open Weights und bereits in Cline verfügbar. Wer Frontend-Code schreibt oder Design-Aufgaben hat, sollte das Modell testen - die Benchmark-Daten sprechen für sich.

2. Preisdruck nutzen: Ein 744B-Open-Weights-Modell auf Frontier-Niveau bedeutet: Wer bisher für teure API-Aufrufe bei US-Anbietern zahlt, hat jetzt eine ernstzunehmende Alternative. Besonders für Unternehmen, die Modelle selbst hosten wollen oder müssen.

3. Open Weights als Trend: Nach DeepSeek, Qwen und jetzt GLM-5.2 wird deutlich: Die stärksten offenen Modelle kommen aus China. Für europäische Unternehmen, die Souveränität und Unabhängigkeit suchen, ist das eine strategisch relevante Entwicklung.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen

Designarena auf X ↗ Zai_org auf X ↗ cline auf X ↗ arena auf X ↗ scaling01 auf X ↗

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

GLM 5.2 überholt US-Frontier-Modelle im Frontend-Coding: Chinas Open-Weights-Offensive erreicht die Spitze

Frontier-Niveau mit offenem Zugang

744 Milliarden Parameter und offene Gewichte

Die Lücke wird kleiner

Sicherheitsfrage: Jailbreak-Berichte

🎯 Was das für die Praxis bedeutet

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

GLM 5.2 überholt US-Frontier-Modelle im Frontend-Coding: Chinas Open-Weights-Offensive erreicht die Spitze

Frontier-Niveau mit offenem Zugang

744 Milliarden Parameter und offene Gewichte

Die Lücke wird kleiner

Sicherheitsfrage: Jailbreak-Berichte

🎯 Was das für die Praxis bedeutet

Das könnte Sie auch interessieren

Kimi 2.7 und GLM 5.2: Chinas Frontier-Modelle erhöhen den Druck - während die USA ihr bestes Modell abschalten

GLM-5.1: Chinas Open-Source-Modell schlägt teilweise GPT-5.4 und Opus 4.6 im Coding

DeepSeek-V4-Flash: Performance-Sprung für KI-Agenten und Codex-Integration

Fehler melden

Die KI Woche als App