Mira

Mistral OCR 4: Handschrift, Formeln und 170 Sprachen in einem Modell
Mistrals neues OCR-Modell liest historische Manuskripte, wandelt handgeschriebene Matheprüfungen in LaTeX um - und lässt sich selbst hosten.

Seedance 2.5: ByteDance kündigt 30-Sekunden-4K-Videos an - und Seedance 2.0 liefert natives 4K
ByteDance zeigt auf der FORCE-Konferenz die nächste Generation seines KI-Videomodells. Gleichzeitig generiert Seedance 2.0 ab sofort nativ in 4K.

ElevenLabs Ads Engine:
Werbekampagnen per Klick in 50 Sprachen
ElevenLabs startet ein Lokalisierungs-Tool für Google-, Meta- und LinkedIn-Ads. Die Dubbing-V2-Technologie erhält dabei Stimme und Tonfall des Originals.

HappyHorse 1.1: Alibabas KI-Videogenerator wird erwachsen
Zwei Monate nach dem Launch liefert Alibaba ein substanzielles Update: bessere Charakter-Konsistenz, integrierter Audio-Sync und API-Zugang auf fal.ai. Im Vergleich mit Seedance 2.0 zeigt sich, wo die Grenzen liegen.

Google Vids: KI-Avatare erstellen jetzt professionelle Videos ohne Kamera
53 Presets, 24 Sprachen, Emotion Steering - und das Ganze kostenlos für persönliche Accounts.

Instant-Ramen: Die ersten Bilder von Googles angeblichem Nachfolger für Nano Banana sind da
Seit GPT-image-2 die Messlatte neu definiert hat, muss Google dringend aufholen - jetzt zeigen erste Leaks, wie Googles nächstes Bildmodell aussehen könnte.

KI findet Einzug in Gaming Engines:
Der Weg zum AAA Gaming mit KI wird kürzer
Unreal Engine 6 setzt voll auf KI – und auch Entwickler von World-Modellen zeigen beeindruckende Fortschritte.

Grok Imagine Video 1.5:
xAI überholt mit neuem Video-Modell Seedance 2.0
Elon Musks KI-Unternehmen launcht sein erstes Videogenerierungsmodell - direkt in Grok integriert.

Copilot Cowork ist da:
Microsoft macht KI-Agenten für alle Microsoft-365-Kunden verfügbar
Komplexe Aufgaben über mehrere Tools hinweg delegieren - Microsofts neues Agentensystem läuft auf Anthropic-Modellen und wird nach Verbrauch abgerechnet.

Tesana und die Geburt der KI-Game-Engine:
Spiele bauen ohne eine Zeile Code
Das Startup will 100 Millionen neue Spieleentwickler schaffen. Mit dem eigenen Muranyi-3-Modell entstehen spielbare 3D-Games per Textprompt - und die Konkurrenz schläft nicht.

World of Claudecraft:
Wie die Community aus Fable 5 ein Open-Source-MMORPG baute
Ein WoW-inspiriertes Browser-RPG mit Tausenden Spielern und Hunderten Contributors - komplett mit KI-generiertem Code. Zwei Tage und 200 Dollar reichten für die erste spielbare Version.

Gemini bekommt Canva als Connected App auf der Web-Version
Testing Catalog entdeckt die neue Drittanbieter-Integration in Googles KI-Chatbot - ein Signal für die wachsende Plattformstrategie.

NotebookLM wird zum Forschungsagenten:
Google baut den KI-Assistenten radikal um
Websuche, Code-Ausführung, über 100 Software-Skills und Dutzende Exportformate - NotebookLM verwandelt sich vom Dokumenten-Reader zur autonomen Rechercheplattform.

Ideogram 4: Open-Weights-Bildmodell mit Designfokus und JSON-Prompting
Ideogram veröffentlicht ein 9,3-Milliarden-Parameter-Modell mit Layout-Kontrolle, exakter Textwiedergabe und Farbpaletten-Steuerung. Die Gewichte sind frei zugänglich - für nicht-kommerzielle Nutzung.

Build 2026: Windows wird zur KI-Entwicklerplattform
OpenClaw, native KI-Terminals und ein neues Erweiterungsmodell: Microsoft stellt auf der Build-Konferenz die Weichen für Windows als Zentrum der KI-Entwicklung.

FLUX Virtual Try-On: Black Forest Labs macht Mode-KI in unter 4 Sekunden
Das Freiburger Startup startet ein Tool, das Kleidung fotorealistisch auf beliebige Personen projiziert — mit Logos, Nähten und Prints in voller Detailtreue.

Sesame startet iOS-App:
So klingt KI, wenn sie wirklich zuhört
Das Startup des Oculus-Gründers bringt vier Sprach-Agenten mit eigenem Gedächtnis auf das iPhone - kostenlos in 39 Ländern.

Tencent startet Miora:
Ein Multi-Agenten-Studio für Bild, Video, 3D und UI
Das Agentic Creative Studio merkt sich Stil und Marke, koordiniert spezialisierte KI-Agenten auf einem Canvas und geht jetzt in die internationale Beta.

Higgsfield landet in Adobe:
KI-Video direkt in Premiere Pro und After Effects
Fünf Plugins, ein Panel: Das Startup bringt Reframe, Upscaling, Hintergrundentfernung und promptbasierte Videobearbeitung direkt in Adobes Profi-Timeline.

ChatGPT drängt in PowerPoint:
OpenAI greift Copilot und Claude an
Nach Microsoft und Anthropic bringt nun auch OpenAI einen KI-Assistenten in PowerPoint - kostenlos. Drei KI-Anbieter konkurrieren jetzt innerhalb einer einzigen Anwendung.