Mira

Lyra 2.0: NVIDIA revolutioniert die Generierung von erkundbaren 3D-Welten
Das KI-Modell erschafft in Rekordtempo detaillierte, persistente und vor allem komplett navigierbare Räume aus generierten Videos – ein Durchbruch für Spieleentwicklung und die Simulation von Robotics.

Das Pferd von nirgendwo:
HappyHorse-1.0 und das Stealth-Rennen um KI-Video
Nach Seedance 2.0 kommt das nächste verblüffend starke Modell aus China: Alibaba erobert mit seinem neuen KI-Videogenerator aus dem Stand Platz 1 der weltweiten Leaderboards.

Gemini 3.1 Flash TTS:
Die nächste Generation der KI-Sprachsynthese
Mit Audio Tags und SynthID-Wasserzeichen definiert Google den Standard für KI-Stimmen neu. Wir zeigen, was das Update kann.

SuperSplat: Dieses Open-Source-Tool verwandelt Smartphone-Videos in begehbare 3D-Welten
Fotorealistisch durch Räume laufen, die nur mit dem Handy gescannt wurden — kostenlos, in Echtzeit und auf jedem Gerät. 3D Gaussian Splatting macht es möglich.

Skills in Chrome: Google macht KI-Prompts zu wiederverwendbaren Ein-Klick-Workflows
Schluss mit Copy-Paste: Googles neue Skills-Funktion verwandelt bewährte Prompts in permanente Browser-Werkzeuge — tab-übergreifend und sofort einsatzbereit.

Copilot in Word bekommt Track Changes:
Microsofts Antwort auf Claude for Word
Satya Nadella stellt persönlich vor: Copilot kann jetzt Änderungen nachverfolgen, Kommentare schreiben und Dokumente wie ein menschlicher Kollege bearbeiten — gebaut für Juristen und Compliance.

Claude for Word: Wie Anthropic Microsoft im eigenen Wohnzimmer vorführt
Schluss mit zerschossenen Formaten: Anthropic integriert Claude tief in Microsoft Word. Dank echtem Tracked Changes stellt das Plugin den teuren Copiloten in den Schatten.

Seedance 2.0 bei Higgsfield:
Produktionsreife Videos mit nativer Vertonung
Das Modell verspricht konsistente Multi-Kamera-Setups, natives Audio und millimetergenaue Frame-Kontrolle für professionelle Workflows.

Alibaba launcht Wan 2.7:
Ein Modell für Bild und Video
Das neue Open-Source-System vereint Generierung und Editing in einer Architektur — und war am Launchtag bereits in ComfyUI, WaveSpeed AI und fal.ai einsatzbereit.

Tencent veröffentlicht 3D-Gamechanger:
Hunyuan3D 2.1
Das Open-Source-Modell generiert produktionsreife 3D-Assets aus einem einzigen Foto — und löst das größte Problem bisheriger Modelle.

Gmail AI Inbox: Googles KI-Posteingang kostet 250 Dollar im Monat
Gemini 3 sortiert E-Mails in To-dos und Themen statt chronologischer Liste. Zunächst nur für US-Nutzer des AI-Ultra-Abos.

VibeVoice: Microsofts Open-Source-Stimme kann 90 Minuten am Stück sprechen
Voice Cloning aus 10 Sekunden, Echtzeit-TTS mit 300ms Latenz, Spracherkennung für 60-Minuten-Aufnahmen — alles unter MIT-Lizenz auf GitHub mit 26.000 Stars.

Voxtral TTS: Mistral drängt mit Open-Source-Stimmmodell in den Voice-Markt
4 Milliarden Parameter, 9 Sprachen, Voice Cloning ab 3 Sekunden, 70ms Latenz, Open Weights — Mistral AI drängt mit aggressivem Preismodell in den Voice-AI-Markt.

Suno v5.5: Mit der eigenen Stimme Songs erzeugen
Sunos neues Modell bringt drei Features, die KI-Musik persönlich machen: Voice-Upload mit Verifizierung, maßgeschneiderte Modelle auf den eigenen Sound und geschmacksbasiertes Tuning.

CapCut Video Studio: ByteDance baut das erste KI-Filmstudio im Browser
Skript, Charakterdesign, Storyboard und Videogenerierung mit Seedance 2.0 — alles in einer App. Was bisher Teams erforderte, braucht jetzt einen Prompt.

Lyria 3 Pro: Google DeepMinds Musikmodell versteht jetzt Songstruktur
Tracks bis 3 Minuten mit Intro, Strophe und Refrain — Lyria 3 Pro kommt gleichzeitig in Gemini, Vertex AI, Google Vids und ProducerAI. Grammy-Gewinner nutzen es bereits.

Veo in Google Ads: Aus Bildern werden automatisch Werbevideos
Google integriert sein stärkstes Videomodell direkt in die Werbeplattform. Drei Fotos hochladen, zehn Sekunden Video erhalten — ohne Produktionsteam.

Dreamina Seedance 2.0 jetzt in CapCut:
KI-Video mit synchronem Audio aus einer Hand
ByteDance integriert sein stärkstes Videomodell direkt in die Editing-Plattform — inklusive Lippensynchronisation, Spatial Sound und multimodaler Steuerung. Der Rollout startet in sieben Ländern.

Mirror Mirror AI: KI-Produktfotos für Fashion ohne ein einziges Shooting
Das israelische Startup ersetzt klassische Modefotografie durch KI-generierte Produktbilder — inklusive virtuellem Anprobieren und automatischem Hintergrundwechsel.

OpenClaw + Seedance + Premiere Pro:
Der vollautonome Videoproduktions-Workflow
Ein viraler X-Post zeigt, wie ein KI-Agent Video generiert, in Premiere Pro importiert und autonom schneidet — ohne menschliches Eingreifen.