Baidu hat heute sein neues Flaggschiff-Modell ERNIE 5.1 vorgestellt - und die Zahlen dahinter sind bemerkenswerter als das Modell selbst. Der chinesische Tech-Konzern hat das Training so radikal optimiert, dass die Gesamtkosten nur noch 6 Prozent dessen betragen, was vergleichbare Industriemodelle verschlingen. Das ist nicht bloß eine Verbesserung, sondern eine andere Größenordnung.
Weniger Parameter, mehr Leistung
Gegenüber dem Vorgänger ERNIE 5.0 hat Baidu die Gesamtzahl der Parameter auf rund ein Drittel geschrumpft, die aktiven Parameter auf die Hälfte. Trotzdem (oder gerade deswegen) steigt die Leistung: Auf dem LMArena Search Leaderboard landet ERNIE 5.1 auf Platz 4 weltweit und ist damit das beste chinesische Modell in der Rangliste. Im Bereich Rechts- und Behördendokumente steht es sogar global an erster Stelle.
Das Fundament dafür liefert ein neues Trainingsverfahren, das Baidu als "disaggregated fully-asynchronous reinforcement learning" bezeichnet. Vereinfacht: Die üblichen Engpässe beim Training großer Modelle - Divergenzen zwischen Trainings- und Inferenzphase, niedrige Ressourcenauslastung - werden durch ein asynchrones System entschärft, das stabileres Langzeit-Reinforcement-Learning ermöglicht.
Agent statt Chatbot
Baidus strategischer Schwerpunkt liegt nicht mehr auf dem Sprachmodell als Gesprächspartner, sondern auf dem Modell als autonomen Agenten. Die agentenbasierten Fähigkeiten sollen die des chinesischen Konkurrenten DeepSeek-V4-Pro übertreffen und sich an die Spitzengruppe der geschlossenen westlichen Modelle annähern. Das passt zur Richtung, die Baidu bereits mit dem Enterprise-Desktop-Agenten DuMate eingeschlagen hat.
Beim mathematischen Benchmark AIME26 erreicht das Modell 99,6 Punkte - allerdings mit Tool-Nutzung, also nicht als reines Sprachmodell. Im kreativen Schreiben soll es mit Gemini 3.1 Pro vergleichbar sein.
Der eigentliche Trend: Effizienz schlägt Skalierung
ERNIE 5.1 steht für eine Verschiebung, die sich durch die gesamte Branche zieht: Nicht mehr die schiere Modellgröße entscheidet, sondern wie effizient das Training ist. Wenn ein Top-Modell für ein Siebzehntel der bisherigen Kosten entsteht, verändert das die wirtschaftliche Logik des gesamten KI-Wettbewerbs. Firmen, die heute dreistellige Millionenbeträge in Trainingsläufe stecken, müssen sich fragen, ob sie nicht schlicht zu teuer arbeiten.
🎯 Was das für die Praxis bedeutet
1. Trainingskosten als strategischer Hebel: Ein Modell für 6 Prozent der üblichen Kosten zu trainieren, ist kein Laborerfolg - es verschiebt die Eintrittsbarriere für Unternehmen, die eigene Foundation Models entwickeln wollen.
2. Agent-Fähigkeit prüfen: ERNIE 5.1 zeigt, dass die nächste Leistungsstufe nicht im besseren Chatten liegt, sondern in der autonomen Aufgabenbearbeitung. Wer KI evaluiert, sollte die Agenten-Kompetenz zum zentralen Kriterium machen.
3. Chinesische Modelle beobachten: Die Kombination aus Effizienz und Leistung bei ERNIE 5.1 zeigt, dass der technologische Vorsprung westlicher Modelle schmaler wird. Für globale Unternehmen lohnt sich der Blick auf beide Ökosysteme.