Tencents Forschungsabteilung Hunyuan hat mit HY-World 2.0 ein Open-Source-Weltmodell veröffentlicht, das aus Text, Einzelbildern oder Handyvideos vollständige 3D-Szenen generiert - mit exportfertigen Meshes und Gaussian Splats für Blender, Unity und Unreal Engine. Kein Rendering-Trick, keine Videoillusion: echte, editierbare, begehbare 3D-Welten.
Was HY-World 2.0 konkret liefert
Die Pipeline besteht aus vier Stufen: Panorama-Generierung, Trajektorie-Planung, Welterweiterung und Szenenkomposition. Am Ende steht ein 3D-Asset, das sich direkt in professionelle Game Engines importieren lässt - inklusive Tiefenkarten, Oberflächennormalen und Kameraparametern. Das integrierte WorldMirror 2.0 schafft das in einem einzigen Vorwärtsdurchlauf. Wer ein Handyvideo von einer Straßenecke aufnimmt, bekommt daraus einen digitalen Zwilling.
Der entscheidende Unterschied zu früheren Weltmodellen wie Genie 3 oder Cosmos: Die generierten nur Pixel-Videos - man konnte zuschauen, aber nichts anfassen. HY-World 2.0 produziert persistente, editierbare Objekte. Das ist der Sprung vom Filmeschauen zum Levelbauen.
Das Muster wiederholt sich
Was gerade mit 3D-Assets passiert, kennen andere Branchen bereits. Stockfotografie war eine Milliarden-Industrie, bis Midjourney und DALL-E die Kosten pro Bild auf nahezu null drückten. Shutterstocks Börsenwert ist eingebrochen, Getty Images musste fusionieren. CMS-Templates auf Plattformen wie ThemeForest verlieren massiv an Relevanz, seit KI-Builder wie Framer oder v0.dev individuelle Designs in Minuten erzeugen. Und im Plugin-Markt macht Agentic Coding zunehmend Custom-Lösungen billiger als jede Jahreslizenz.
Jetzt trifft dasselbe Muster die 3D-Branche. Asset Packs auf dem Unreal Marketplace, dem Unity Asset Store oder Sketchfab waren bisher die pragmatische Lösung für Indie-Studios und kleine Teams, die sich keine eigenen 3D-Artists leisten konnten. Wenn ein einzelner Textprompt denselben Output liefert - in höherer Qualität, passgenau auf das eigene Projekt zugeschnitten - verliert der Standardkatalog seinen Daseinszweck.
Kein Einzelfall: Das Feld wird dichter
HY-World 2.0 ist nicht das einzige Werkzeug in dieser Kategorie. World Labs' Marble liefert editierbare 3D-Welten aus Text und Bildern mit Browser-Streaming. Alibaba und Tencent haben bereits die erste Generation offener Weltmodelle vorgestellt. Meshy AI und Tripo AI generieren Game-Ready-Meshes aus Einzelbildern. Und Tencents Modell ist vollständig Open Source - Code, Gewichte, technischer Report. Das senkt die Einstiegshürde für jeden Entwickler mit einer brauchbaren GPU auf null.
Die Konvergenz dieser Werkzeuge beschleunigt sich: GPT-5.5 mit Image 2 hat gezeigt, dass komplette Spielkonzepte aus einem einzigen Prompt entstehen können. Wenn die Generierung der visuellen Assets ebenso trivial wird wie die des Codes, schrumpft die gesamte Wertschöpfungskette auf den kreativen Entwurf zusammen.
🎯 Was das für die Praxis bedeutet
1. Asset-Abhängigkeiten prüfen: Wer heute 3D-Asset-Packs lizenziert oder verkauft, sollte sein Geschäftsmodell sofort auf Haltbarkeit testen. Die generative Alternative ist nicht mehr experimentell, sondern produktionsreif.
2. Eigene Generierungs-Pipeline aufbauen: Studios und Agenturen, die 3D-Content brauchen, sollten HY-World 2.0 und Marble jetzt evaluieren. Die manuelle Modellierung ganzer Umgebungen wird zum Luxus, nicht zum Standard.
3. Kreative Differenzierung statt Katalogware: Der Wert verschiebt sich von der technischen Ausführung hin zur kreativen Vision. Art Direction, Stilkonsistenz und narrative Welten werden wichtiger als das Beherrschen von Polygon-Werkzeugen.