Design & Multimedia

Seed Audio 1.0: Higgsfield gibt KI-Videos eine Stimme
ByteDances universelles Audiomodell läuft jetzt auf Higgsfield und in Claude via MCP. Es klont Stimmen, vertont Videos in 18 Sprachen und erzeugt komplette Soundscapes aus einem Prompt.

Maray Paul spricht im KI Woche Podcast über Kreativität, ästhetische Bilderwelten und die zwei Seiten der KI-Revolution
Im neuen KI Woche Podcast sprechen wir mit LinkedIn-Creatorin Maray Paul über ihre kreative Arbeit mit KI-Bildgeneratoren - von Mid Journey über GPT Image 1.5 bis Seedance 2.0 - und wieviel Leidenschaft dahinter steckt.

Seedance 2.5: ByteDance kündigt 30-Sekunden-4K-Videos an - und Seedance 2.0 liefert natives 4K
ByteDance zeigt auf der FORCE-Konferenz die nächste Generation seines KI-Videomodells. Gleichzeitig generiert Seedance 2.0 ab sofort nativ in 4K.

ElevenLabs Ads Engine:
Werbekampagnen per Klick in 50 Sprachen
ElevenLabs startet ein Lokalisierungs-Tool für Google-, Meta- und LinkedIn-Ads. Die Dubbing-V2-Technologie erhält dabei Stimme und Tonfall des Originals.

HappyHorse 1.1: Alibabas KI-Videogenerator wird erwachsen
Zwei Monate nach dem Launch liefert Alibaba ein substanzielles Update: bessere Charakter-Konsistenz, integrierter Audio-Sync und API-Zugang auf fal.ai. Im Vergleich mit Seedance 2.0 zeigt sich, wo die Grenzen liegen.

Instant-Ramen: Die ersten Bilder von Googles angeblichem Nachfolger für Nano Banana sind da
Seit GPT-image-2 die Messlatte neu definiert hat, muss Google dringend aufholen - jetzt zeigen erste Leaks, wie Googles nächstes Bildmodell aussehen könnte.

Grok Imagine Video 1.5:
xAI überholt mit neuem Video-Modell Seedance 2.0
Elon Musks KI-Unternehmen launcht sein erstes Videogenerierungsmodell - direkt in Grok integriert.

Ideogram 4: Open-Weights-Bildmodell mit Designfokus und JSON-Prompting
Ideogram veröffentlicht ein 9,3-Milliarden-Parameter-Modell mit Layout-Kontrolle, exakter Textwiedergabe und Farbpaletten-Steuerung. Die Gewichte sind frei zugänglich - für nicht-kommerzielle Nutzung.

Bernini: ByteDance veröffentlicht Open-Source-Framework für KI-Videobearbeitung
Ein Sprachmodell plant, ein Diffusionsmodell rendert: ByteDance macht sein neues Framework für Video-Editing und -Generierung unter Apache-2.0-Lizenz frei zugänglich.

FLUX Virtual Try-On: Black Forest Labs macht Mode-KI in unter 4 Sekunden
Das Freiburger Startup startet ein Tool, das Kleidung fotorealistisch auf beliebige Personen projiziert — mit Logos, Nähten und Prints in voller Detailtreue.

Sesame startet iOS-App:
So klingt KI, wenn sie wirklich zuhört
Das Startup des Oculus-Gründers bringt vier Sprach-Agenten mit eigenem Gedächtnis auf das iPhone - kostenlos in 39 Ländern.

Tencent startet Miora:
Ein Multi-Agenten-Studio für Bild, Video, 3D und UI
Das Agentic Creative Studio merkt sich Stil und Marke, koordiniert spezialisierte KI-Agenten auf einem Canvas und geht jetzt in die internationale Beta.

Higgsfield landet in Adobe:
KI-Video direkt in Premiere Pro und After Effects
Fünf Plugins, ein Panel: Das Startup bringt Reframe, Upscaling, Hintergrundentfernung und promptbasierte Videobearbeitung direkt in Adobes Profi-Timeline.

Hell Grind: Higgsfield zeigt ersten KI-Spielfilm in Cannes - aber nicht beim Festival
500.000 Dollar Budget, 80 Prozent davon KI-Compute, 14 Tage Produktion: Die Zahlen beeindrucken. Doch die Premiere fand im Stadtkino statt, nicht im Festivalprogramm.

Googles Videogenerator schwächelt bei Physik:
Seedance 2.0 bleibt überlegen
Community-Vergleiche zeigen: Bei Bewegungen und Kollisionen liegt ByteDances Modell deutlich vorn.

Gemini Omni: Googles Alleskönner versteht und erzeugt Video, Bild und Audio
Das neue Multimodal-Modell kombiniert Geminis Weltwissen mit generativen Medienfähigkeiten - und macht Videoproduktion per Textprompt möglich.

Sonys KI-Kamera wird zum Meme:
Xperia 1 VIII AI Assistant sorgt für Spott
Die offiziellen Beispielfotos des AI Camera Assistant sehen schlechter aus als die Originale. Das Netz lacht, Sony schweigt.

KI-Film wird erwachsen:
Von Cannes bis zur 23-Minuten-Episode in 4 Tagen
InVideos Kurzfilm läuft offiziell in Cannes. Gossip Goblins Patchwright erreicht 10 Millionen Views. Und der cleverste Trick: KI-generierte Bloopers vermenschlichen nicht-existierende Schauspieler.

HeyGen in Codex: Avatar-Videos direkt aus dem Code-Editor
Ein Klick genügt - A-Roll, B-Roll, Untertitel und Motion Graphics in einem Workflow. Video as Code wird Realität.

Gemini Omni: Google testet neues Video-Modell mit lesbarem Text
UI-Leaks zeigen Remix-Funktionen, Objekt-Ersetzung und ein Template-System. Das Modell läuft intern auf dem Veo-Stack - und könnte zur I/O 2026 offiziell starten.