Acht Tage vor der Google I/O 2026 am 19. Mai kippt Google eine Reihe von Gemini-Updates heraus, die einzeln betrachtet klein wirken, in der Summe aber zeigen, wohin die Reise geht: Die Gemini-App soll vom Chatfenster zur Systemschicht werden, die sich in jede Oberfläche einklinkt.

Overlay: Gemini lernt, was auf dem Bildschirm passiert

Das neue Gemini Overlay auf Android funktioniert ähnlich wie Circle to Search - nur eben mit dem vollen Gemini-Modell dahinter. Nutzer können einen Bereich auf dem Bildschirm markieren und das Markierte direkt als Kontext in ihren Prompt einbeziehen. Das heißt: Gemini versteht nicht nur Text, den man eintippt, sondern auch das, was gerade auf dem Bildschirm zu sehen ist. Für die tägliche Nutzung ist das ein spürbarer Unterschied - statt Screenshots zu machen und hochzuladen, reicht ein Fingerstrich.

File-Generierung direkt im Chat

Eine zweite Neuerung klingt banal, verändert aber den Workflow: Gemini kann jetzt PDFs, Google Docs, Sheets und Slides direkt im Chat generieren und zum Download anbieten. Statt „erstelle mir eine Zusammenfassung" und dann manuelles Copy-Paste in ein Dokument gibt es jetzt eine fertige Datei. Für Büroarbeit mit wiederkehrenden Berichten, Zusammenfassungen oder Datenaufbereitungen spart das konkret Zeit.

Skills: Prompts zum Wiederverwenden

Für Workspace-Nutzer testet Google Gemini Skills in Chrome - gespeicherte Prompt-Vorlagen, die sich mit einem Klick auslösen lassen. Die Idee: Wer täglich denselben Prompt für E-Mail-Zusammenfassungen oder Datenextraktion nutzt, muss ihn nicht jedes Mal neu formulieren. Das ist konzeptionell das Gleiche, was xAI gerade mit Grok Skills baut - ein Zeichen dafür, dass beide Unternehmen denselben Engpass erkannt haben: Nutzer wollen keine Chatbots, sie wollen Automatisierungen.

Gemini Omni: Video-Modell im Hintergrund

Parallel taucht bei einigen Nutzern bereits das Gemini Omni Videomodell in der Oberfläche auf - mit Remix-Funktionen, direktem Editing im Chat und Template-Vorlagen. Ob das zur I/O offiziell vorgestellt wird, ist unklar, aber die technische Grundlage auf Basis des Veo-Stacks steht offensichtlich bereit.

🎯 Was das für die Praxis bedeutet

1. Overlay auf Android testen: Wer ein aktuelles Android-Gerät nutzt, sollte das Gemini-Overlay aktivieren. Die Möglichkeit, Bildschirminhalte direkt als Kontext zu verwenden, spart bei Recherchen und Vergleichen spürbar Zeit.

2. File-Generierung für Routineberichte: Regelmäßige Reports, Meeting-Zusammenfassungen oder Datenexporte lassen sich jetzt direkt als fertiges Dokument aus dem Chat heraus erstellen - ohne den Umweg über Copy-Paste.

3. I/O im Blick behalten: Am 19. Mai dürften diese Einzelteile in ein größeres Bild eingebettet werden. Wer Gemini produktiv einsetzt, sollte die Keynote verfolgen - die Skills- und Overlay-Funktionen werden vermutlich deutlich ausgebaut.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen
@GeminiApp auf X ↗ 9to5Google Overlay ↗
Teilen: