🎨 Design & Multimedia
Angriff auf Adobe und Figma: Anthropic veröffentlicht Claude Design
Mit dem neuen, experimentellen Tool 'Claude Design' revolutioniert Anthropic den UI/UX-Workflow und ermöglicht interaktive Layouts in einer kollaborativen Canvas-Oberfläche.
Lyra 2.0: NVIDIA revolutioniert die Generierung von erkundbaren 3D-Welten
Das KI-Modell erschafft in Rekordtempo detaillierte, persistente und vor allem komplett navigierbare Räume aus generierten Videos – ein Durchbruch für Spieleentwicklung und die Simulation von Robotics.
Das Pferd von nirgendwo: HappyHorse-1.0 und das Stealth-Rennen um KI-Video
Nach Seedance 2.0 kommt das nächste verblüffend starke Modell aus China: Alibaba erobert mit seinem neuen KI-Videogenerator aus dem Stand Platz 1 der weltweiten Leaderboards.
Gemini 3.1 Flash TTS: Die nächste Generation der KI-Sprachsynthese
Mit Audio Tags und SynthID-Wasserzeichen definiert Google den Standard für KI-Stimmen neu. Wir zeigen, was das Update kann.
SuperSplat: Dieses Open-Source-Tool verwandelt Smartphone-Videos in begehbare 3D-Welten
Fotorealistisch durch Räume laufen, die nur mit dem Handy gescannt wurden — kostenlos, in Echtzeit und auf jedem Gerät. 3D Gaussian Splatting macht es möglich.
Seedance 2.0 bei Higgsfield: Produktionsreife Videos mit nativer Vertonung
Das Modell verspricht konsistente Multi-Kamera-Setups, natives Audio und millimetergenaue Frame-Kontrolle für professionelle Workflows.
Alibaba launcht Wan 2.7: Ein Modell für Bild und Video
Das neue Open-Source-System vereint Generierung und Editing in einer Architektur — und war am Launchtag bereits in ComfyUI, WaveSpeed AI und fal.ai einsatzbereit.
Tencent veröffentlicht 3D-Gamechanger: Hunyuan3D 2.1
Das Open-Source-Modell generiert produktionsreife 3D-Assets aus einem einzigen Foto — und löst das größte Problem bisheriger Modelle.
VibeVoice: Microsofts Open-Source-Stimme kann 90 Minuten am Stück sprechen
Voice Cloning aus 10 Sekunden, Echtzeit-TTS mit 300ms Latenz, Spracherkennung für 60-Minuten-Aufnahmen — alles unter MIT-Lizenz auf GitHub mit 26.000 Stars.
Voxtral TTS: Mistral drängt mit Open-Source-Stimmmodell in den Voice-Markt
4 Milliarden Parameter, 9 Sprachen, Voice Cloning ab 3 Sekunden, 70ms Latenz, Open Weights — Mistral AI drängt mit aggressivem Preismodell in den Voice-AI-Markt.
Suno v5.5: Mit der eigenen Stimme Songs erzeugen
Sunos neues Modell bringt drei Features, die KI-Musik persönlich machen: Voice-Upload mit Verifizierung, maßgeschneiderte Modelle auf den eigenen Sound und geschmacksbasiertes Tuning.
CapCut Video Studio: ByteDance baut das erste KI-Filmstudio im Browser
Skript, Charakterdesign, Storyboard und Videogenerierung mit Seedance 2.0 — alles in einer App. Was bisher Teams erforderte, braucht jetzt einen Prompt.