Google DeepMind hat mit Project Genie etwas veröffentlicht, das die Grenze zwischen KI-generiertem Video und interaktiver Welt aufhebt. Statt passiver Clips erzeugt das zugrundeliegende Genie 3-Modell navigierbare 3D-Umgebungen, durch die sich der Nutzer in Echtzeit bewegen, mit Objekten interagieren und die Physik der Szene erleben kann. Man tippt „Futuristische Stadt bei Regen" — und steht Sekunden später mitten drin. Die Gaming-Industrie reagierte prompt: Unity fiel um 24 Prozent, Roblox um 13 Prozent — an einem einzigen Tag.

Wie Genie 3 funktioniert

Genie 3 ist ein sogenanntes World Model — ein KI-System, das nicht nur Bilder erzeugt, sondern versteht, wie Umgebungen funktionieren und auf Handlungen reagieren. Das Modell generiert fotorealistische Welten in 720p bei 24 Frames pro Sekunde, simuliert Physik (Wasser, Licht, Wetter) und behält ein visuelles Gedächtnis: Objekte bleiben dort, wo man sie hinterlassen hat, auch wenn man den Blick abwendet und zurückkehrt. Nutzer können während der Exploration über Textprompts dynamische Änderungen vornehmen — etwa Nebel hinzufügen oder die Tageszeit wechseln.

Seit dem 29. Januar 2026 ist Project Genie für Google AI Ultra-Abonnenten in den USA verfügbar (ab 18 Jahren). Der Zugang ist bewusst als experimenteller Forschungsprototyp deklariert — Sessions sind auf rund 60 Sekunden begrenzt, die Auflösung wirkt auf größeren Bildschirmen etwas verwaschen, und komplexe Multi-Agenten-Interaktionen überfordern das Modell noch.

Was die Community zeigt: Die besten Demos

Auf X hat die Veröffentlichung von Genie 3 eine Welle beeindruckender Demos ausgelöst:

1. Das GPS-Wunder@MattMcGill_ entdeckte eine faszinierende emergente Fähigkeit: Das GPS-Dashboard in einem KI-generierten Auto aktualisiert sich korrekt, während der Nutzer durch die Welt navigiert. Rund 3.000 Likes für das, was viele als das eindrucksvollste Detail des gesamten Modells bezeichneten.

2. AAA-Qualität durch neuronale Simulation@bilawalsidhu lieferte einen tiefgehenden Review und beschrieb Genie 3 als Äquivalent zu AAA-Game-Engines — nur dass die gesamte Welt durch reine neuronale Berechnung entsteht, nicht durch handgefertigte Assets und Regelsysteme.

3. Zelda, Dark Souls, GTA — alles per PromptEscapist Magazine dokumentierte, wie das Modell spielbare Level im Stil von Zelda (mit Gleit-Mechanik und Art-Style), Dark Souls (inklusive UI und Respawn-Mechanik) und GTA (Helikopter über offener Welt) erzeugt.

4. Prompt-Engineering für Welten@fofrAI erstellte eine umfassende Sammlung von Tests: Was passiert, wenn man das Lenkrad dreht? Wenn man einen Gegenstand trifft? Wie promptet man Charaktere in die Welt?

Warum Genie 3 mehr ist als eine Tech-Demo

Der entscheidende Unterschied zu bisherigen KI-Videogeneratoren wie Sora 2, Seedance 2.0 oder Kling 3.0: Genie 3 erzeugt keine Clips zum Ansehen, sondern Räume zum Betreten. Das Modell versteht Kausalität — Aktionen haben Konsequenzen, die physikalisch plausibel simuliert werden. Google nutzt diese Technologie intern bereits, um KI-Agenten wie SIMA (einen Roboter-Agenten) in diversen simulierten Umgebungen zu trainieren, was Entwicklungskosten senkt und die Szenarien-Vielfalt erhöht.

Für Forscher ist Genie 3 vor allem ein Schritt in Richtung allgemeiner künstlicher Intelligenz (AGI): Ein System, das nicht nur generiert, sondern die Welt modelliert, vorhersagt und auf Eingaben reagiert — die Grundbausteine für maschinelles Verständnis von Realität.

🎯 Was das für die Praxis bedeutet

1. Game-Industrie vor Paradigmenwechsel: Genie 3 ist noch ein Prototyp, aber die Richtung ist klar: prozedural generierte, interaktive Welten per Textprompt. Spieleentwickler sollten sich mit dieser Technologie vertraut machen — nicht als Ersatz, sondern als Beschleuniger für Prototyping und Level-Design.

2. Simulationen für Training einsetzen: Unternehmen, die Robotik, autonomes Fahren oder komplexe Logistik entwickeln, könnten bald KI-generierte Welten als Testumgebungen nutzen — schneller und günstiger als physische Simulatoren.

3. Bildung und Immersion: Vom Geschichtsunterricht (begehbare historische Städte) bis zur Architekturplanung (Gebäudeentwürfe in Echtzeit erleben) — World Models eröffnen ein Universum neuer Anwendungsfälle jenseits von Gaming.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen
Google DeepMind ↗
Teilen: