Google macht ernst mit seiner On-Device-Strategie: Mit Gemma 4 stellt das Unternehmen seine bisher leistungsstärksten "offenen" Modelle vor. Der strategische Schachzug: Eine freizügigere Lizenzierung und eine Architektur, die massiv Leistung mit geringem Hardware-Hunger vereint — mit dem klaren Ziel, verlorene Marktanteile zurückzuerobern.
Der Wechsel zur Apache 2.0-Lizenz
Ein zentraler Bestandteil der Neuankündigung ist die Wahl der Apache 2.0-Lizenz. Damit hebt sich Google von den oft restriktiveren Lizenzen von Meta ab und setzt ein starkes Zeichen in Richtung Entwickler-Community. Beobachter wie Aakash Gupta auf X bewerten dies als strategischen Schritt, um Gemma zum neuen Standard für kommerzielle Anwendungen von Startups sowie Konzernen zu machen.
Besonders im Bereich der lokalen Nutzung zeigt Gemma 4 seine Stärken: Selbst die kleinsten Modelle (2B und 4B) erreichen fast 60 Prozent im MMLU Pro Benchmark und laufen problemlos auf Consumer-Endgeräten wie Handys oder Raspberry Pis. Damit treibt Google die Vision von KI voran, die aus Datenschutz- und Kostengründen direkt beim Nutzer läuft.
Vergleich mit dem neuen Spitzenreiter Qwen 3.6 Plus
In der Community wird Gemma 4 derzeit stark mit dem Vorgängermodell Qwen 3.5 verglichen. Am Papier zeigt aber bereits der direkte Benchmark-Vergleich zwischen Gemma 4 und der neuen Preview von (→ KI Woche Analyse) ein differenziertes Bild.
Qwen 3.6 Plus scheint in zentralen Architektur-Metriken weiterhin deutlich leistungsstärker zu sein: Mit sage und schreibe 1.000.000 Token Kontextfenster vernichtet es den vergleichsweise begrenzten Kontextraum von Gemma 4 (256.000 Token). Auch beim generellen Datendurchsatz (40 Token/s gegenüber 10 Token/s) zieht Qwen auf dem Papier vorbei. Gemma 4 punktet dagegen vor allem durch eine etwas niedrigere asynchrone Latenz — und vor allem mit dem immensen Vertrauensbonus des Google-Ökosystems im Hintergrund.
🎯 Was das für die Praxis bedeutet
1. Echte On-Device-KI wird spürbar: Mit Modellen wie Gemma 4 können komplexe Analysen erstmals datenschutzkonform und kostenschonend direkt auf Edge-Devices ausgeführt werden.
2. China gibt weiterhin den Takt vor: Wenn es um pure Performance und gigantische Kontextfenster geht, bleibt auch nach dem Gemma-Launch Qwen 3.6 Plus für Großaufgaben der Goldstandard.
3. Open-Source verlagert sich: Googles Wechsel auf Apache 2.0 gibt Startups und Entwicklern eine verlässlichere Grundlage für den Bau eigener Produkte ohne weitreichende kommerzielle Einschränkungen.