Alibaba hat mit Qwen3.7-Max sein neuestes KI-Flaggschiff offiziell vorgestellt. Anders als bei bisherigen Modellen, die primär als Chat-Assistenten dienten, positioniert der chinesische Tech-Gigant die neue Version als grundlegendes Fundament für autonome Software-Agenten. Das Modell wurde speziell darauf trainiert, komplexe Aufgaben über Hunderte von Einzelschritten hinweg selbstständig auszuführen.

Die offizielle Ankündigung erfolgte im Rahmen des Apsara Cloud Summit in Hangzhou. Alibaba betonte dabei die wachsende Bedeutung von Modellen, die nicht nur auf Eingaben antworten, sondern eigenständig Werkzeuge nutzen und Fehler korrigieren können. Ein zentrales Feature dafür ist die Option preserve_thinking, die es dem Modell erlaubt, seinen internen Denkprozess über mehrere Dialogschritte hinweg aufrechtzuerhalten. Das Modell ist direkt mit gängigen Agenten-Werkzeugen wie Claude Code oder OpenClaw kompatibel.

Erste Plätze in Agenten- und Coding-Benchmarks

Die Neuausrichtung schlägt sich direkt in den Leistungstests nieder. Die Analyse-Plattform Artificial Analysis hat die ersten Testergebnisse des Modells veröffentlicht. Im Terminal Bench 2.0 (Terminus) - einem Benchmark, der die Steuerung von Server-Umgebungen und Kommandozeilen-Tools simuliert - erzielt Qwen3.7-Max einen Spitzenwert von 69,7 Punkten. Damit verweist es etablierte Konkurrenten wie das jüngst veröffentlichte Gemini Flash 3.5 oder DeepSeek V4 Pro Max auf die hinteren Plätze.

Auch beim klassischen Software-Engineering zeigt sich das Modell stark: Im SWE-Verified-Test, bei dem reale GitHub-Probleme gelöst werden müssen, erreicht Qwen3.7-Max 80,4 Prozent und zieht damit mit Spitzenreitern wie dem Gemini Omni-System gleich. Im anspruchsvollen GPQA-Diamond-Test, der akademische Fragen auf Doktorandenniveau aus den Bereichen Physik, Chemie und Biologie stellt, übertrifft das Modell mit 92,4 Prozent ebenfalls viele westliche Pendants.

Co-Design von Hardware und Software: Der Zhenwu M890 Chip

Für den produktiven Einsatz solcher Agenten sind immense Rechenkapazitäten und niedrige Latenzen erforderlich. Alibaba hat aus diesem Grund parallel den neuen Beschleuniger-Chip Zhenwu M890 vorgestellt. Dieser Chip soll speziell für die Ausführung von Modellen optimiert sein, die kontinuierlich im Hintergrund arbeiten und Hunderte von Werkzeugen (Tool-Aufrufe) ansteuern.

Um die Leistungsfähigkeit dieser Kombination zu demonstrieren, präsentierte Alibaba ein Experiment zur automatischen Kernel-Optimierung. Dabei lief das Modell 35 Stunden lang vollkommen autonom auf den eigenen Zhenwu-Chips, bewältigte über 1.000 Tool-Aufrufe und erreichte am Ende eine zehnfache Beschleunigung des Systems - ohne dass ein menschlicher Entwickler eingreifen musste. Im Gegensatz zu den Vorgängerversionen der Qwen-Reihe, die häufig unter einer freien Lizenz veröffentlicht wurden, bleibt Qwen 3.7 in der aktuellen Preview-Phase zunächst ein proprietäres Modell, das über Alibabas Model Studio angeboten wird.

🎯 Was das für die Praxis bedeutet

1. Agenten-Workflows vorbereiten: Unternehmen sollten ihre IT-Infrastruktur und internen Tools auf Kompatibilität mit standardisierten Schnittstellen wie dem Model Context Protocol vorbereiten, da KI-Modelle zunehmend als eigenständige Akteure statt als reine Chatbots agieren.

2. Spezialisierte Hardware einplanen: Der Trend geht hin zu integrierten Systemen aus Hardware und Software. Bei der Planung von eigenen Serverkapazitäten müssen zukünftig spezielle Beschleuniger-Chips für Agenten-Workloads berücksichtigt werden.

3. Proprietäre Previews nutzen: Da Spitzenmodelle wie Qwen3.7-Max vorerst nicht als Open-Source-Gewichte frei verfügbar sind, sollten Entwickler frühzeitig API-Zugänge in Alibabas Model Studio testen, um den Anschluss bei der Agenten-Entwicklung nicht zu verpassen.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen
Qwen Blog ↗ Alibaba Group auf X ↗ Artificial Analysis auf X ↗
Teilen: