Die IT-Abteilung der Stadtverwaltung von Rio de Janeiro hat ein eigenes KI-Modell veröffentlicht - und sorgt damit international für Aufsehen. Rio 3.5 Open 397B ist ein Sprachmodell mit 397 Milliarden Parametern, frei verfügbar auf HuggingFace, unter MIT-Lizenz. Entwickelt wurde es von IplanRIO - der Behörde, die normalerweise die städtischen Websites und Digitaldienste betreibt. Eine eigene Projektseite dokumentiert die Modellfamilie.
Was steckt technisch dahinter?
Rio 3.5 basiert auf Qwen 3.5, dem Open-Source-Modell des chinesischen Alibaba-Konzerns. Es handelt sich um eine sogenannte Mixture-of-Experts-Architektur (MoE): Von den 397 Milliarden Gesamtparametern sind bei jeder Anfrage nur rund 17 Milliarden gleichzeitig aktiv. Das macht das Modell trotz seiner nominellen Größe vergleichsweise effizient zu betreiben.
Der Beitrag aus Rio liegt nach eigenen Angaben im sogenannten Post-Training - also der Feinabstimmung eines bereits existierenden Basismodells. Konkret soll IplanRIO eine Technik namens SwiReasoning eingesetzt haben, die dynamisch zwischen klassischem Schritt-für-Schritt-Denken (Chain-of-Thought) und einer effizienteren Variante im latenten Raum des Modells umschaltet.
Öffentlich finanziert, ein Jahr Training
Die Stadtregierung bestätigt auf ihren offiziellen Kanälen, dass das Modell über ein Jahr mit öffentlichen Mitteln trainiert wurde. „Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário" - KI sei keine ferne, ausländische Angelegenheit aus Milliardenlaboren, so die Darstellung der Präfektur.
Die Reaktionen in der Entwickler-Community schwankten zwischen Begeisterung und Verwunderung. Dass eine Kommunalverwaltung ein Modell dieser Größenordnung veröffentlicht, hat es so noch nicht gegeben. Der Vorgang reiht sich in ein Muster ein, das sich in den letzten Monaten verstärkt: Dank leistungsfähiger Open-Source-Basismodelle wie Qwen oder Kimi können auch Akteure ohne eigene Milliarden-Infrastruktur Modelle erstellen, die in Benchmarks mit kommerziellen Produkten konkurrieren - durch gezieltes Post-Training.
Fragen zur Herkunft der Gewichte
Für Diskussionen sorgt eine Analyse des KI-Startups Nex Ecosystem. In einem ausführlichen GitHub-Issue veröffentlichte das Unternehmen eine technische Gewichtsuntersuchung, laut der Rio 3.5 zu erheblichen Teilen auf ihrem eigenen Open-Source-Modell Nex N2 Pro basieren soll. Die von Nex publizierte Formel lautet: „Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5". Die Analyse komme zudem zu dem Ergebnis, dass sich „kein Hinweis auf eigenes Training" finden lasse. Zudem zeige das Modell bei bestimmten Abfragen den Modellnamen „Nex" an, so das Startup.
Die Stadtverwaltung hat sich zu diesen Vorwürfen bislang nicht öffentlich geäußert. Grundsätzlich erlaubt die MIT-Lizenz, unter der sowohl Qwen als auch Nex N2 Pro veröffentlicht wurden, die freie Verwendung und Modifikation der Modellgewichte. Die Diskussion dreht sich daher weniger um die rechtliche Zulässigkeit als um die Frage der Transparenz: Wie viel des veröffentlichten Modells ist tatsächlich eigene Entwicklungsarbeit?
Was der Fall zeigt
Unabhängig davon, wie die Herkunftsfrage geklärt wird, illustriert der Fall einen grundlegenden Trend: Die Eintrittsbarriere für leistungsfähige KI-Modelle sinkt rapide. Wenn eine Kommunalverwaltung ein Modell veröffentlichen kann, das in Benchmarks mit kommerziellen Produkten konkurriert, verschiebt sich die Debatte: weg von der Frage, wer überhaupt ein Modell bauen kann - hin zur Frage, wie viel eigene Leistung dahintersteckt und wie transparent die Herkunft dokumentiert wird.
🎯 Was das für die Praxis bedeutet
1. Post-Training als Demokratisierer: Wer heute ein leistungsfähiges KI-Modell will, muss es nicht von Grund auf trainieren. Gezieltes Feintuning auf Open-Source-Basis kann mit einem Bruchteil der Kosten vergleichbare Ergebnisse liefern.
2. Modellherkunft prüfen: Die Zusammensetzung von KI-Modellen wird zunehmend relevanter. Vor dem Einsatz eines Open-Source-Modells lohnt sich ein Blick auf die Trainingsdokumentation und die tatsächliche Herkunft der Gewichte.
3. Kommunen als KI-Akteure: Wenn eine Stadtverwaltung ein 397B-Modell veröffentlichen kann, gibt es für Unternehmen, Hochschulen und Behörden kaum noch Ausreden, Open-Source-KI nicht zumindest zu evaluieren.


