Mit Nemotron 3 Super hat NVIDIA völlig überraschend einen wahren Spitzenreiter in das Rennen der Open-Weight-Modelle geworfen. Wer dachte, die großen Durchbrüche blieben in diesem Frühjahr aus, sieht sich durch dieses 120-Milliarden-Parameter-Modell eines Besseren belehrt.
Extreme Effizienz durch Mixture-of-Experts
Nemotron 3 Super basiert auf einer hybriden Mamba-Transformer Architektur, was es enorm schnell und speichereffizient macht. Bemerkenswert ist, dass von den insgesamt 120 Milliarden Parametern (120B) beim Einsatz (Inference) nur 12 Milliarden aktiv genutzt werden. Dies führt laut NVIDIA zu einer atemberaubenden 7,5-fachen Beschleunigung im direkten Vergleich zum ähnlich großen, chinesischen Konkurrenten Qwen3.5-122B.
Agentic Reasoning: Ein Gehirn für KI-Agenten
Was Nemotron 3 Super so besonders macht, ist seine unfassbar hohe Leistungsfähigkeit im Bereich "Agentic Reasoning", dem logischen und autonomen Handeln von KI-Agenten. Mit einem Score von über 60% im SWE-Bench Verified schlägt es bisherige Bestmarken für reale Programmier-Aufgaben. Auf dem PinchBench – einem Härtetest für klassische KI-Agenten – verzeichnet das Modell mit fast 86% ebenfalls einen unangefochtenen Top-Wert unter den offenen Modellen.
Der Kontext lässt sich dabei auf bis zu eine Million Tokens ausweiten. Entwickler können dem offenen Nemotron-Modell damit extrem tiefgreifende Aufgaben überlassen, die es wie ein autarkes, blitzschnelles System abarbeitet.
🎯 Was das für die Praxis bedeutet
1. Das bisher beste offene Coding-Modell: Unternehmen, die ein auf Entwickler-Code spezialisiertes, superperformantes System lokal hosten wollen, finden hier unkompliziert den neuen Goldstandard.
2. Echte KI-Agenten zum Selberbauen: Aufgrund der ressourcenschonenden Hybrid-Architektur ist Nemotron 3 perfekt dafür geeignet, lang laufende Prozesse als autonomer KI-Agent zu überwachen und auszuführen. Es bringt von Natur aus die richtigen Anlagen mit.
3. Enorme Kosteneffizienz: Da nur 12 Milliarden Parameter aktiv berechnet werden müssen, lässt sich das neue NVIDIA-Modell auf verhältnismäßig kostengünstiger Hardware betreiben, obwohl es die Performance echter Open-Weight Schwergewichte liefert.