Googles Desktop-App für den Mac war bisher ein hübsches, aber zahnloses Chatfenster. Das könnte sich bald grundlegend ändern. Kurz vor dem Start der Google I/O 2026 deuten geleakte Build-Daten, die TestingCatalog veröffentlicht hat, auf vier neue Fähigkeiten hin, die aus der App eine vollwertige Agenten-Plattform machen würden.
Vier mögliche Features deuten auf einen Agenten-Hub
Die auffälligste mögliche Neuerung wäre die Erweiterung von Gemini Spark auf den Desktop. Was bisher als Beta in der Web-App aufgetaucht war - ein persönlicher KI-Agent für Postfach-Sortierung und Online-Aufgaben - soll laut den Build-Daten künftig direkt auf lokale Ordner zugreifen können. Nutzer könnten Spark auf einen Ordner zeigen und den Agenten Dateien bearbeiten, analysieren, verschieben und umbenennen lassen, inklusive Anbindung an Google Drive und andere Google-Dienste.
Damit würde Google ein Territorium betreten, das bisher vor allem OpenAIs Codex und Anthropics Claude Code besetzt haben: den lokalen Rechner als Arbeitsumgebung für KI-Agenten. Der potenzielle Unterschied: Google brächte sein gesamtes Ökosystem mit - Gmail, Kalender, Drive, Chrome-Sessions.
Gemini Live als Desktop-Overlay
Feature Nummer zwei wäre ein Gemini-Live-Modus als schwebende Überlagerung auf dem Desktop. Gemini soll laut den Hinweisen beobachten können, was auf dem Bildschirm passiert, und in Echtzeit per Sprachmodell darauf reagieren. Das würde Google direkt gegen ChatGPTs macOS-Companion und die Screen-Aware-Experimente von Anthropic positionieren.
Stream to Cursor: Wird der Mauszeiger zum Agenten-Auslöser?
Die dritte mögliche Ergänzung heißt intern offenbar Stream to Cursor und knüpft an das Magic-Pointer-Konzept an, das Google bei der Android Show vorgestellt hatte. Statt auf einen Prompt zu warten, würde der Cursor den Kontext um das Element lesen, über dem er schwebt, und relevante Vorschläge liefern. Die Grenze zwischen Zeigegerät und Agenten-Trigger würde damit verschwimmen.
Veo4 Omni: Videogenerierung im Desktop-Client
Schließlich deuten die Build-Daten darauf hin, dass auch die Videogenerierung in den Desktop-Client integriert werden könnte - unter dem internen Label Veo4 Omni. Der Name legt ein einheitliches multimodales Ausgabesystem nahe, das unter dem breiteren Gemini-Omni-Dach zusammengeführt würde.
Googles Antwort auf die Agenten-Konkurrenz
Sollten sich die Leaks bestätigen, würde Google den Desktop-Client darauf vorbereiten, den vollständigen agentischen Stack zu beherbergen - statt als dünner Wrapper um ein Chat-Fenster zu dienen. Das wäre ein direkter Angriff auf Perplexitys Personal Computer und würde zur Agenten-Offensive passen, die Google auf der I/O zeigen dürfte.
Die Datenschutz-Fragen blieben dabei relevant. Schon bei der ersten Spark-Beta zeigte sich, dass der Agent Name, Kontaktdaten und Dateien mit Dritten teilen soll - und laut Googles eigenem Onboarding-Text sogar Einkäufe tätigen könnte, ohne vorher um Erlaubnis zu fragen.
🎯 Was das für die Praxis bedeutet
1. Desktop-Agenten beobachten: Mit Gemini Spark, OpenAI Codex und Claude Code zeichnen sich drei ernst zu nehmende Desktop-Agenten ab. Unternehmen sollten die Entwicklung verfolgen und früh testen, welcher am besten in ihre bestehende Infrastruktur passt.
2. Google-Ökosystem als Vorteil prüfen: Wer bereits auf Google Workspace setzt, könnte mit Spark einen Agenten bekommen, der Gmail, Drive und Kalender nativ versteht - ein potenzieller Integrationsvorteil, den die Konkurrenz so nicht bieten kann.
3. Datenschutz-Richtlinien aktualisieren: Lokaler Dateizugriff durch einen Cloud-Agenten erfordert klare interne Regeln - besonders bei sensiblen Dokumenten und in regulierten Branchen.