xAI hat Grok Imagine Video 1.5 für alle Nutzer freigegeben - und demonstriert die Fähigkeiten mit einem zweiminütigen KI-generierten Trailer zu Homers Odyssee im Stil eines Hollywood-Blockbusters der 1970er Jahre. Elon Musks Kommentar dazu: "Full movies by the end of the year."

Was Grok Imagine Video 1.5 kann

Das Modell basiert auf xAIs Aurora-Engine, einer autoregressiven Mixture-of-Experts-Architektur. Anders als Diffusionsmodelle behandelt Aurora Videoframes als diskrete Tokens und sagt sie sequenziell vorher - ähnlich wie Sprachmodelle das nächste Wort vorhersagen. Eine Technik namens "Temporal Latent Flow" sorgt für konsistente Beleuchtung, Schatten und Objektidentität über die gesamte Clipdauer.

Die größte Neuerung: Audio und Video entstehen im selben Durchlauf. Soundeffekte, Umgebungsgeräusche und sogar Dialoge werden nativ in derselben Inferenz generiert wie das Bild - kein separates Audiomodell nötig. Die Lippensynchronisation soll sich dadurch spürbar verbessert haben.

In Zahlen: Die Clips laufen mit 24 Bildern pro Sekunde bei bis zu 720p Auflösung und dauern 6 bis 15 Sekunden, die sich zu längeren Sequenzen verketten lassen. Die schnelle Variante Video 1.5 Fast erzeugt einen 6-Sekunden-Clip in rund 25 Sekunden - fast doppelt so schnell wie der Vorgänger. Trainiert wurde das Modell auf xAIs Supercomputer Colossus mit 110.000 NVIDIA GB200 GPUs.

Platz 1 in der Arena

Laut xAI hat das Modell Platz 1 auf dem Image-to-Video Arena Leaderboard erreicht und ByteDances Seedance 2.0 mit einem Vorsprung von 52 Elo-Punkten überholt. Auch Google Veo und HappyHorse 1.0 liegen dahinter.

Die Konkurrenz schläft allerdings nicht: ByteDance plant laut Berichten bereits für Anfang Juli den Launch von Seedance 2.5 - mit Clips länger als 15 Sekunden. Seedance 2.0 soll zudem noch diese Woche 4K-Unterstützung erhalten.

Dazu kommen neue Workflow-Werkzeuge: Projects zum Organisieren von Clips in Ordnern, Multiple Agents für parallele Generierung mehrerer Prompts gleichzeitig, und eine Suchfunktion für die eigene Bibliothek. Das Modell ist über die xAI-API (Modellname: grok-imagine-video-1.5), auf grok.com/imagine und in den Grok-Apps für iOS und Android verfügbar.

Der Odyssee-Trailer als Showcase

Für die Demonstration hat xAI mit dem Digitalkünstler David Thompson (Heavy Pulp) zusammengearbeitet. Der über zweiminütige Trailer reimaginiert Homers Odyssee als Kinofilm der 70er Jahre - mit 36 konsistenten Einstellungen. Thompson hatte zuvor bereits einen viralen Ilias-Trailer für xAI erstellt, den Musk Anfang Juni teilte.

Musks Prognose geht noch weiter: Er erwartet, dass KI-generierte Filme noch dieses Jahr "schaubar" werden und Grok bis Ende 2027 "richtig gute" Filme produzieren kann. Branchenexperten bleiben vorsichtiger - Charakterkonsistenz über lange Laufzeiten, Energiebedarf und Urheberrechtsfragen sind noch ungelöst.

🎯 Was das für die Praxis bedeutet

1. Nativer Sound als Differenzierungsmerkmal: Die integrierte Audio-Video-Generierung spart einen kompletten Produktionsschritt. Für Social-Media-Content und schnelle Prototypen ist das ein echter Vorteil gegenüber Konkurrenten, die separate Audio-Pipelines brauchen.

2. API-Zugang für Entwickler: Über die xAI-API lässt sich Grok Imagine Video 1.5 direkt in eigene Anwendungen integrieren. Wer KI-Videogenerierung in Produkte einbauen will, hat jetzt eine weitere Option neben Runway, Luma und Google Veo.

3. Erwartungsmanagement bei "ganzen Filmen": Musks Prognose "Full movies by the end of the year" sollte mit Vorsicht genossen werden. 15-Sekunden-Clips verketten ist etwas anderes als 90 Minuten narrative Kohärenz.

4. Wettbewerb treibt Qualität: Der enge Kampf zwischen xAI, ByteDance (Seedance) und Google (Veo) um Arena-Platzierungen beschleunigt die Entwicklung. Für Anwender heißt das: Die Qualität verbessert sich im Monatsrhythmus.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen
xAI Blog ↗
Teilen: