mira
Claude for Word: Wie Anthropic Microsoft im eigenen Wohnzimmer vorführt
Schluss mit zerschossenen Formaten: Anthropic integriert Claude tief in Microsoft Word. Dank echtem Tracked Changes stellt das Plugin den teuren Copiloten in den Schatten.
Google aktualisiert Gemini: Neue Projekt-Ordner und interaktive Datenanalyse
Mit der Einführung von 'Notebooks' wird die KI zum synchronisierten Projekt-Hub – ergänzt durch anpassbare 3D-Modelle im Chat.
Seedance 2.0 bei Higgsfield: Produktionsreife Videos mit nativer Vertonung
Das Modell verspricht konsistente Multi-Kamera-Setups, natives Audio und millimetergenaue Frame-Kontrolle für professionelle Workflows.
Karpathy verabschiedet sich von RAG: Das neue 'Second Brain' läuft lokal
Der ehemalige OpenAI-Forschungsleiter setzt für sein Wissensmanagement jetzt auf ein lokales LLM, das seine Obsidian-Notes als strukturierte Wiki kompiliert.
Gmail AI Inbox: Googles KI-Posteingang kostet 250 Dollar im Monat
Gemini 3 sortiert E-Mails in To-dos und Themen statt chronologischer Liste. Zunächst nur für US-Nutzer des AI-Ultra-Abos.
Willow Atlas 1: Neue Diktiersoftware fordert OpenAI und ElevenLabs heraus
Das Y-Combinator-Startup macht Spracheingabe alltagstauglich — mit kontextbewusster Formatierung und HIPAA-Zertifizierung.
VibeVoice: Microsofts Open-Source-Stimme kann 90 Minuten am Stück sprechen
Voice Cloning aus 10 Sekunden, Echtzeit-TTS mit 300ms Latenz, Spracherkennung für 60-Minuten-Aufnahmen — alles unter MIT-Lizenz auf GitHub mit 26.000 Stars.
Voxtral TTS: Mistral drängt mit Open-Source-Stimmmodell in den Voice-Markt
4 Milliarden Parameter, 9 Sprachen, Voice Cloning ab 3 Sekunden, 70ms Latenz, Open Weights — Mistral AI drängt mit aggressivem Preismodell in den Voice-AI-Markt.
Suno v5.5: Mit der eigenen Stimme Songs erzeugen
Sunos neues Modell bringt drei Features, die KI-Musik persönlich machen: Voice-Upload mit Verifizierung, maßgeschneiderte Modelle auf den eigenen Sound und geschmacksbasiertes Tuning.
CapCut Video Studio: ByteDance baut das erste KI-Filmstudio im Browser
Skript, Charakterdesign, Storyboard und Videogenerierung mit Seedance 2.0 — alles in einer App. Was bisher Teams erforderte, braucht jetzt einen Prompt.
HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle
75 Web-Komponenten, 37 Native-Komponenten, Tailwind CSS v4, CSS-only Animationen und ein MCP-Server für KI-Agenten — HeroUI liefert das umfassendste Update seiner Geschichte.
Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen
Die neue Plattform orchestriert mehrere KI-Agenten parallel — Code, Bilder, 3D-Modelle und Daten gleichzeitig. Was Stunden dauerte, soll in Sekunden erledigt sein.