Wer schon einmal versucht hat, ein Schulungsvideo aufzunehmen, kennt das Elend: schlechtes Licht, Versprecher, drei Stunden für vier Minuten Ergebnis. Google will das mit einem Update für Google Vids erledigen - dem hauseigenen Videotool innerhalb von Google Workspace. Statt vor die Kamera zu treten, spricht jetzt ein KI-Avatar den gewünschten Text. Die Technik dahinter: Googles Videomodell Veo 3.1 und Gemini 3.1 Flash.
53 Avatare, 24 Sprachen, null Kamera
Die Auswahl umfasst laut Google 53 vorgefertigte Avatare in drei Stilrichtungen: photorealistisch, 3D-Cartoon und Graphic Novel. Wer es individueller braucht, kann Custom Avatars mit eigenem Firmenlogo und Markenhintergrund erstellen. Die Lippensynchronisation sei dabei fortgeschritten genug, um natürlich wirkende Konversationstöne zu erzeugen.
Besonders spannend: Ab Ende Juni soll ein Emotion Steering hinzukommen. Damit lässt sich die emotionale Tonlage des Avatars gezielt steuern - von sachlich bis enthusiastisch. Prompt-basierte Kommandos sollen die digitalen Sprecher sogar dazu bringen, sich im Bild zu bewegen, Objekte zu greifen oder durch eine Szene zu laufen. Die Google-KI-Maschinerie läuft auf Hochtouren.
Von der Folie zum fertigen Video
Eine Funktion, die im Büroalltag viel Arbeit sparen könnte: Google Slides lassen sich direkt in Videos umwandeln. Google Vids erzeugt aus der Präsentation automatisch ein Storyboard und schreibt ein Skript, das der Avatar dann vorträgt. Was bisher einen Nachmittag mit Bildschirmaufnahme und Nachbearbeitung kostete, soll in wenigen Minuten erledigt sein.
Zusätzlich können mehrere Videos gleichzeitig generiert werden, und bestehende Veo-Clips lassen sich zu längeren, konsistenten Sequenzen erweitern. Wer schon Lyria 3 Pro in Google Vids genutzt hat, kennt das Prinzip: Google baut sein Videotool systematisch zur All-in-One-Produktionsumgebung aus.
Kostenlos für US-Accounts, globaler Rollout folgt
Bemerkenswert ist die Preisstrategie: Google stellt die KI-Avatare für persönliche Accounts in den USA zunächst kostenlos zur Verfügung - mit 10 Videogenerierungen pro Monat. Der globale Rollout soll im Laufe des Sommers folgen. Enterprise-Kunden mit Workspace-Abo erhalten höhere Limits und erweiterte Funktionen. Für Anbieter wie HeyGen, die bisher den Avatar-Video-Markt dominiert haben, dürfte das unangenehm werden - besonders wenn Google die 24 Sprachen (darunter Arabisch, Hindi, Russisch und Bengalisch) als Argument für globale Skalierung nutzt.
Der Schritt passt in ein Muster: Erst wurde Gemini tief in Workspace verankert, dann kam die Video-Produktion dazu. Google positioniert sich damit als der Anbieter, der KI-Tools nicht als separates Premium-Produkt verkauft, sondern in bestehende Arbeitswerkzeuge integriert.
🎯 Was das für die Praxis bedeutet
1. Schulungsvideos selbst produzieren: Teams mit begrenztem Budget können Onboarding- und Trainingsvideos jetzt ohne externe Dienstleister erstellen. Die Slides-zu-Video-Pipeline senkt die Einstiegshürde massiv.
2. Mehrsprachige Kommunikation skalieren: Mit 24 unterstützten Sprachen können internationale Unternehmen denselben Inhalt parallel in verschiedenen Märkten ausspielen - ohne für jede Sprache einen eigenen Sprecher zu buchen.
3. Avatar-Video-Startups beobachten: HeyGen, Synthesia und ähnliche Anbieter stehen unter Druck, wenn Google vergleichbare Funktionen kostenlos in ein bestehendes Ökosystem mit Milliarden Nutzern einbettet. Wer solche Tools nutzt, sollte die Alternativen prüfen.



