Design & Multimedia

Tencent HY-World 2.0:
3D-Assets trifft das Schicksal der Stockbilder
Ein Prompt, eine Szene - Tencents Open-Source-Weltmodell generiert exportfertige 3D-Welten für Unity und Unreal Engine. Der Markt für vorgefertigte 3D-Asset-Packs steht vor demselben Wertverfall wie Stockfotos und CMS-Templates.

Jedes KI-Bild trägt einen unsichtbaren Fingerabdruck - und die meisten Nutzer wissen es nicht
GPT Image 2 bettet C2PA-Metadaten ein, Google brennt SynthID direkt in die Pixel. Beide Markierungen überleben Screenshots, Zuschnitte und Kompression. Die EU-Wasserzeichen-Pflicht kommt im Dezember.

World Labs: Fei-Fei Lis Marble verwandelt Text in exportfertige 3D-Welten
Das Startup der Stanford-Koryphäe liefert neue Marble-Updates für 3D-Weltgenerierung mit Echtzeit-Editing, Chisel-Sculpting und direktem Export für Unity und Unreal Engine.

Grok Imagine - das wahrscheinlich meist unterschätzte Bild- und Videomodell
Das aktuelle Update bringt beeindruckende Verbesserungen bei Lip-Sync und Audio. Der Agent Mode vereint alles auf einer Leinwand.

xAI bringt Voice Cloning per API
Elon Musks KI-Firma veröffentlicht eine API zum Klonen von Stimmen in unter 2 Minuten und unterstützt 28 Sprachen.

Verified by Spotify: Echte Künstler bekommen ein Häkchen — KI-Personas nicht
Spotify führt den ersten offiziellen Echtheitsbadge für Künstlerprofile ein. Über 99 Prozent der aktiv gesuchten Künstler sind ab Launch verifiziert. KI-generierte Personas sind explizit ausgeschlossen — und neue Künstler-Details erscheinen für alle Profile.

Angriff auf Adobe und Figma:
Anthropic veröffentlicht Claude Design
Mit dem neuen, experimentellen Tool 'Claude Design' revolutioniert Anthropic den UI/UX-Workflow und ermöglicht interaktive Layouts in einer kollaborativen Canvas-Oberfläche.

Lyra 2.0: NVIDIA revolutioniert die Generierung von erkundbaren 3D-Welten
Das KI-Modell erschafft in Rekordtempo detaillierte, persistente und vor allem komplett navigierbare Räume aus generierten Videos – ein Durchbruch für Spieleentwicklung und die Simulation von Robotics.

Das Pferd von nirgendwo:
HappyHorse-1.0 und das Stealth-Rennen um KI-Video
Nach Seedance 2.0 kommt das nächste verblüffend starke Modell aus China: Alibaba erobert mit seinem neuen KI-Videogenerator aus dem Stand Platz 1 der weltweiten Leaderboards.

Gemini 3.1 Flash TTS:
Die nächste Generation der KI-Sprachsynthese
Mit Audio Tags und SynthID-Wasserzeichen definiert Google den Standard für KI-Stimmen neu. Wir zeigen, was das Update kann.

SuperSplat: Dieses Open-Source-Tool verwandelt Smartphone-Videos in begehbare 3D-Welten
Fotorealistisch durch Räume laufen, die nur mit dem Handy gescannt wurden — kostenlos, in Echtzeit und auf jedem Gerät. 3D Gaussian Splatting macht es möglich.

Seedance 2.0 bei Higgsfield:
Produktionsreife Videos mit nativer Vertonung
Das Modell verspricht konsistente Multi-Kamera-Setups, natives Audio und millimetergenaue Frame-Kontrolle für professionelle Workflows.

Alibaba launcht Wan 2.7:
Ein Modell für Bild und Video
Das neue Open-Source-System vereint Generierung und Editing in einer Architektur — und war am Launchtag bereits in ComfyUI, WaveSpeed AI und fal.ai einsatzbereit.

Tencent veröffentlicht 3D-Gamechanger:
Hunyuan3D 2.1
Das Open-Source-Modell generiert produktionsreife 3D-Assets aus einem einzigen Foto — und löst das größte Problem bisheriger Modelle.

VibeVoice: Microsofts Open-Source-Stimme kann 90 Minuten am Stück sprechen
Voice Cloning aus 10 Sekunden, Echtzeit-TTS mit 300ms Latenz, Spracherkennung für 60-Minuten-Aufnahmen — alles unter MIT-Lizenz auf GitHub mit 26.000 Stars.

Voxtral TTS: Mistral drängt mit Open-Source-Stimmmodell in den Voice-Markt
4 Milliarden Parameter, 9 Sprachen, Voice Cloning ab 3 Sekunden, 70ms Latenz, Open Weights — Mistral AI drängt mit aggressivem Preismodell in den Voice-AI-Markt.

Suno v5.5: Mit der eigenen Stimme Songs erzeugen
Sunos neues Modell bringt drei Features, die KI-Musik persönlich machen: Voice-Upload mit Verifizierung, maßgeschneiderte Modelle auf den eigenen Sound und geschmacksbasiertes Tuning.

CapCut Video Studio: ByteDance baut das erste KI-Filmstudio im Browser
Skript, Charakterdesign, Storyboard und Videogenerierung mit Seedance 2.0 — alles in einer App. Was bisher Teams erforderte, braucht jetzt einen Prompt.

Lyria 3 Pro: Google DeepMinds Musikmodell versteht jetzt Songstruktur
Tracks bis 3 Minuten mit Intro, Strophe und Refrain — Lyria 3 Pro kommt gleichzeitig in Gemini, Vertex AI, Google Vids und ProducerAI. Grammy-Gewinner nutzen es bereits.

Veo in Google Ads: Aus Bildern werden automatisch Werbevideos
Google integriert sein stärkstes Videomodell direkt in die Werbeplattform. Drei Fotos hochladen, zehn Sekunden Video erhalten — ohne Produktionsteam.