Acht Tage vor der Google I/O 2026 am 19. Mai kippt Google eine Reihe von Gemini-Updates heraus, die einzeln betrachtet klein wirken, in der Summe aber zeigen, wohin die Reise geht: Die Gemini-App soll vom Chatfenster zur Systemschicht werden, die sich in jede Oberfläche einklinkt.
Overlay: Gemini lernt, was auf dem Bildschirm passiert
Das neue Gemini Overlay auf Android funktioniert ähnlich wie Circle to Search - nur eben mit dem vollen Gemini-Modell dahinter. Nutzer können einen Bereich auf dem Bildschirm markieren und das Markierte direkt als Kontext in ihren Prompt einbeziehen. Das heißt: Gemini versteht nicht nur Text, den man eintippt, sondern auch das, was gerade auf dem Bildschirm zu sehen ist. Für die tägliche Nutzung ist das ein spürbarer Unterschied - statt Screenshots zu machen und hochzuladen, reicht ein Fingerstrich.
File-Generierung direkt im Chat
Eine zweite Neuerung klingt banal, verändert aber den Workflow: Gemini kann jetzt PDFs, Google Docs, Sheets und Slides direkt im Chat generieren und zum Download anbieten. Statt „erstelle mir eine Zusammenfassung" und dann manuelles Copy-Paste in ein Dokument gibt es jetzt eine fertige Datei. Für Büroarbeit mit wiederkehrenden Berichten, Zusammenfassungen oder Datenaufbereitungen spart das konkret Zeit.
Skills: Prompts zum Wiederverwenden
Für Workspace-Nutzer testet Google Gemini Skills in Chrome - gespeicherte Prompt-Vorlagen, die sich mit einem Klick auslösen lassen. Die Idee: Wer täglich denselben Prompt für E-Mail-Zusammenfassungen oder Datenextraktion nutzt, muss ihn nicht jedes Mal neu formulieren. Das ist konzeptionell das Gleiche, was xAI gerade mit Grok Skills baut - ein Zeichen dafür, dass beide Unternehmen denselben Engpass erkannt haben: Nutzer wollen keine Chatbots, sie wollen Automatisierungen.
Gemini Omni: Video-Modell im Hintergrund
Parallel taucht bei einigen Nutzern bereits das Gemini Omni Videomodell in der Oberfläche auf - mit Remix-Funktionen, direktem Editing im Chat und Template-Vorlagen. Ob das zur I/O offiziell vorgestellt wird, ist unklar, aber die technische Grundlage auf Basis des Veo-Stacks steht offensichtlich bereit.
🎯 Was das für die Praxis bedeutet
1. Overlay auf Android testen: Wer ein aktuelles Android-Gerät nutzt, sollte das Gemini-Overlay aktivieren. Die Möglichkeit, Bildschirminhalte direkt als Kontext zu verwenden, spart bei Recherchen und Vergleichen spürbar Zeit.
2. File-Generierung für Routineberichte: Regelmäßige Reports, Meeting-Zusammenfassungen oder Datenexporte lassen sich jetzt direkt als fertiges Dokument aus dem Chat heraus erstellen - ohne den Umweg über Copy-Paste.
3. I/O im Blick behalten: Am 19. Mai dürften diese Einzelteile in ein größeres Bild eingebettet werden. Wer Gemini produktiv einsetzt, sollte die Keynote verfolgen - die Skills- und Overlay-Funktionen werden vermutlich deutlich ausgebaut.