Modelle & Agenten

Google führt das KI-Rennen wieder an

Gemini Flash 3.5 auf Opus-4.7-Level - und viermal so schnell bei halben Kosten. Doch der nächste Schlag kommt bestimmt.

Kai · 19. Mai 2026 · 8 Min. Lesezeit

Google hat auf der hauseigenen Entwicklerkonferenz I/O 2026 eine umfassende Frontaloffensive gestartet. Unter dem Leitmotiv "Welcome to the agentic Gemini era" präsentierte CEO Sundar Pichai ein Ökosystem, das im KI-Sektor seinesgleichen sucht. Während spezialisierte Mitbewerber wie Anthropic sich stark auf B2B- und Entwicklernischen fokussieren und OpenAI vor allem Verbraucher anspricht, besetzt Google die Rolle des technologischen Allrounders. Kein anderes Unternehmen deckt die gesamte Wertschöpfungskette ab – von Modellen (Gemini 3.5 Flash, Gemini Omni) über eigene Hardware (8. TPU-Generation) und Entwicklerplattformen bis hin zur tiefen Systemintegration in Workspace, Suche, YouTube und E-Commerce.

Gemini 3.5 Flash: Das neue Arbeitstier mit Frontier-Intelligenz

Das wichtigste Modell-Upgrade der Konferenz ist Gemini 3.5 Flash. Das Modell wurde laut Googles Ankündigung gezielt für hochfrequente, latenzkritische Workflows konzipiert. Die eigentliche Überraschung liegt in der Leistungsdichte: 3.5 Flash agiert bei typischen Alltags- und Programmieraufgaben auf dem Niveau von Anthropics Flaggschiff-Modell Claude Opus 4.7 – arbeitet jedoch viermal so schnell und verursacht weniger als die Hälfte der Kosten. Damit verschiebt Google das Preis-Leistungs-Verhältnis im High-End-Segment massiv.

Im sogenannten Artificial Analysis Index positioniert sich 3.5 Flash im oberen rechten Quadranten – dort, wo hohe Geschwindigkeit und Spitzenqualität zusammentreffen. Entwickler müssen sich somit nicht mehr zwischen Antwortzeit und logischer Präzision entscheiden. Erste Analysen aus der Entwickler-Community bestätigen diese Benchmarks und zeigen, dass das Modell in der Praxis die Latenzbarriere für produktive KI-Anwendungen durchbricht.

Die Benchmarks im Detail

Die nackten Zahlen unterstreichen diesen Sprung: Im Coding-Agenten-Test Terminal-Bench 2.1 erzielt Gemini 3.5 Flash hervorragende 76,2 Prozent. Im Benchmark für allgemeine Agenten-Fähigkeiten (GDPval-AA) kommt das Modell auf 1656 Elo-Punkte. Auch bei der Tool-Nutzung über das Model Context Protocol (83,6 Prozent im MCP Atlas) und im multimodalen Reasoning (84,2 Prozent im CharXiv Reasoning) schlägt es Googles bisheriges Flaggschiff Gemini 3.1 Pro deutlich. Es ist das erste Mal, dass ein Flash-Modell das Pro-Modell der Vorgängergeneration in nahezu allen Kategorien überflügelt.

Vibe Coding: Kollaborative Subagenten verändern die Entwicklung

Besonders sichtbar wird die Leistungssteigerung beim sogenannten Vibe Coding. Gemini 3.5 Flash ist in der Lage, komplexe Webanwendungen und funktionale Benutzeroberflächen direkt aus natürlicher Sprache zu bauen. Dies geschieht durch ein System koordinierter Subagenten: Mehrere spezialisierte KI-Instanzen arbeiten unter menschlicher Anleitung parallel an verschiedenen Teilen des Codes, migrieren Altsysteme auf moderne Frameworks (wie Next.js) oder setzen Forschungsberichte in lauffähige Prototypen um.

CodeMender: Googles Antwort auf das Cybersecurity-Thema

Um die Zuverlässigkeit und Sicherheit von KI-generiertem Code zu gewährleisten, stellte Google DeepMind den autonomen Sicherheitsagenten CodeMender vor. Das System spürt Schwachstellen im Quellcode auf, analysiert deren Kontext und behebt sie proaktiv. Es validiert Patches mithilfe interner Simulationen und schließt so Sicherheitslücken, bevor der Code in Produktion geht. In der Fachwelt wird CodeMender als direkter Gegenentwurf zum bisherigen Mythos gewertet, dass Anthropics Claude-Modelle im Software-Engineering auf absehbare Zeit unschlagbar bleiben würden.

Universal Cart: Die Revolution des digitalen Shoppings

Ein weiteres Highlight ist die Einführung von Universal Cart, einer KI-gesteuerten E-Commerce-Plattform, die das Shopping im Netz radikal vereinfacht. Der Assistent überwacht Preise, führt Kompatibilitätsprüfungen durch (beispielsweise beim Kauf von Computer-Komponenten) und verwaltet Kundenbindungsprogramme im Google Wallet. Durch die Integration mit Google Pay und Partnern wie Nike, Sephora, Target, Walmart sowie tausenden Shopify-Händlern können Einkäufe plattformübergreifend mit einem einzigen Klick abgeschlossen werden.

Gemini Spark: Der 24/7-Assistent für den Alltag

Für Endanwender am Desktop wird Gemini Spark zum zentralen Anlaufpunkt. Spark läuft als cloudbasierter Agent rund um die Uhr im Hintergrund. Mit Erlaubnis des Nutzers überwacht er Applikationen, recherchiert selbstständig und führt komplexe administrative Aufgaben aus – selbst wenn das Gerät gesperrt oder offline ist. Die Integration in Google Workspace ermöglicht zudem Funktionen wie den "Daily Brief", eine personalisierte morgendliche Audio-Zusammenfassung der wichtigsten E-Mails, Termine und Dokumente. Aufgrund regulatorischer Hürden wird Gemini Spark in der Europäischen Union jedoch mit Verzögerung starten.

Ecosystem-Wide AI Integration: Die komplette Neugestaltung der Kerndienste

Google baut seine gesamte Dienstelandschaft KI-nativ um. Die klassische Websuche wird durch einen interaktiven "AI Mode" ergänzt. Das Kreativstudio Google Flow ermöglicht die iterative Erstellung und Bearbeitung von Medien, während Entwickler über die Gemini API auf "Managed Agents" zugreifen können. Gleichzeitig verbessert Google seine Tools zur Erkennung und Kennzeichnung von KI-generierten Inhalten (wie Synthesia-ähnliche Wasserzeichen), um die Transparenz im Netz zu erhöhen. Auch das neue, universell multimodale Modell Gemini Omni ist ab sofort fest in die Produktwelt integriert.

Infrastruktur: Spezialisierte TPU-Power der achten Generation

Um die agentische Ära wirtschaftlich und skalierbar zu betreiben, setzt Google auf maßgeschneiderte Hardware. Die neue, achte Generation der Tensor Processing Units (TPUs) spaltet das Rechenzentrum in zwei spezialisierte Chip-Typen auf: TPU 8t für das ressourcenintensive Modelltraining (skalierbar bis zu 9.600 Chips im Superpod mit Virgo-Netzwerk) und TPU 8i für die Inferenz im Live-Betrieb. Der Inferenz-Chip verfügt über 384 MB On-Chip-SRAM, um riesige KV-Caches für langlaufende Agenten-Workflows performant vorzuhalten, und nutzt eine Boardfly-Netzwerktopologie. Laut Google liefert diese Kombination eine um 80 Prozent bessere Leistung pro investiertem Dollar bei doppelter Energieeffizienz auf Basis des hauseigenen Axion-Prozessors.

Genie 3: Google DeepMind erschafft frei begehbare 3D-Welten

Mit Genie 3 präsentierte Google DeepMind ein neues generatives Weltmodell. Das System kann aus einfachen Textbeschreibungen oder statischen Bildern interaktive, dreidimensionale Räume in Echtzeit (24 FPS, 720p) berechnen. Genie 3 nutzt nun auch Street-View-Daten, um reale Stadtumgebungen detailgetreu zu simulieren.

Diese Technologie bildet ein wichtiges Fundament für die physische KI: Autonome Roboter und die selbstfahrenden Systeme der Google-Schwester Waymo ("Waymo World Model") können in diesen lebensechten und physikalisch konsistenten 3D-Simulationen trainiert werden, bevor sie in der physischen Welt zum Einsatz kommen. Dies beschleunigt den Trainingsprozess für physische KI-Agenten dramatisch.

Abonnements & Preisstruktur: AI Ultra wird massentauglich

Google strukturiert auch seine Preismodelle um, um die breite Nutzung zu fördern. Der Preis für das Spitzenabonnement AI Ultra sinkt von 250 auf 200 Dollar pro Monat. Zusätzlich wird ein neuer AI Ultra 100 Tarif für 100 Dollar monatlich eingeführt. Das klassische AI Pro Abo enthält künftig YouTube Premium Lite. In allen Abo-Modellen ist der Zugriff auf Gemini Omni bereits enthalten.

Wettbewerbsdruck: Apple, OpenAI und Anthropic geraten in Zugzwang

Googles geballte I/O-Präsentation erhöht die Taktfrequenz der Branche erneut. Konkurrenten wie OpenAI (mit einem erwarteten GPT-5.6) und Anthropic (mit Claude Sonnet 4.8) stehen unter Druck, zeitnah mit eigenen Spitzenmodellen zu antworten. Google selbst hat das nächste große Flaggschiff Gemini 3.5 Pro bereits für Juni angekündigt.

Unter besonderem Zugzwang steht Apple. Auf der bevorstehenden WWDC-Entwicklerkonferenz am 8. Juni muss der iPhone-Konzern eigene KI-Lösungen präsentieren. Da Apple keine eigenen Modelle in der Größenordnung der Konkurrenz besitzt, deuten Gerüchte darauf hin, dass Siri als Marktplatz für externe KI-Dienste (Gemini, Claude, Grok) positioniert werden soll, um über die tiefe Betriebssystem-Integration den Consumer-Markt neu aufzurollen.

🎯 Was das für die Praxis bedeutet

1. Kostenstruktur evaluieren: Gemini 3.5 Flash verschiebt die Wirtschaftlichkeitsgrenze für Agenten-Workflows. Bestehende API-Implementierungen sollten auf Flash 3.5 getestet werden, da es oft die Leistung früherer Flaggschiffe bei einem Bruchteil der Kosten bietet.

2. Multicloud-Architektur etablieren: Die extrem schnellen Release-Zyklen zeigen, dass eine exklusive Bindung an einen Provider riskant ist. Entwickler sollten flexible Abstraktionsschichten für den Modellwechsel pflegen.

3. Juni als Richtungsweiser einplanen: Mit dem anstehenden Release von Gemini 3.5 Pro und der Apple WWDC stehen im Juni strategische Entscheidungen für die Integration mobiler KI-Assistenten an.

4. API-Zugriff nutzen: Da Desktop-Agenten wie Spark wegen der EU-Regulierung vorerst nicht in Europa starten, bleibt die direkte Nutzung der Gemini API über das Google AI Studio der beste Weg, um agentische Funktionen lokal zu erproben.

Dieser Artikel enthält eingebettete Inhalte Dritter (z. B. Videos, Social-Media-Beiträge). kiwoche.com berichtet über diese Inhalte, macht sie sich jedoch nicht zu eigen. Die Rechte und die Verantwortung liegen beim jeweiligen Urheber bzw. Plattformbetreiber.

📰 Quellen

Google Keyword Blog (Gemini 3.5) ↗ Google I/O Keynote ↗ Google AI Subscriptions ↗ Google Keyword Blog (Gemini Omni) ↗ 8th Generation TPU Blog ↗ Next Evolution of Gemini App ↗ Search I/O 2026 ↗ Flow Updates ↗ AI Studio I/O 2026 ↗ Gemini for Science ↗ Identifying AI-generated media ↗ Managed Agents Gemini API ↗ Community-Benchmark auf X ↗

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Markus M. Kirchmair

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Google führt das KI-Rennen wieder an

Gemini 3.5 Flash: Das neue Arbeitstier mit Frontier-Intelligenz

Die Benchmarks im Detail

Vibe Coding: Kollaborative Subagenten verändern die Entwicklung

CodeMender: Googles Antwort auf das Cybersecurity-Thema

Universal Cart: Die Revolution des digitalen Shoppings

Gemini Spark: Der 24/7-Assistent für den Alltag

Ecosystem-Wide AI Integration: Die komplette Neugestaltung der Kerndienste

Infrastruktur: Spezialisierte TPU-Power der achten Generation

Genie 3: Google DeepMind erschafft frei begehbare 3D-Welten

Abonnements & Preisstruktur: AI Ultra wird massentauglich

Wettbewerbsdruck: Apple, OpenAI und Anthropic geraten in Zugzwang

🎯 Was das für die Praxis bedeutet

Die KI Woche als App

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Google führt das KI-Rennen wieder an

Gemini 3.5 Flash: Das neue Arbeitstier mit Frontier-Intelligenz

Die Benchmarks im Detail

Vibe Coding: Kollaborative Subagenten verändern die Entwicklung

CodeMender: Googles Antwort auf das Cybersecurity-Thema

Universal Cart: Die Revolution des digitalen Shoppings

Gemini Spark: Der 24/7-Assistent für den Alltag

Ecosystem-Wide AI Integration: Die komplette Neugestaltung der Kerndienste

Infrastruktur: Spezialisierte TPU-Power der achten Generation

Genie 3: Google DeepMind erschafft frei begehbare 3D-Welten

Abonnements & Preisstruktur: AI Ultra wird massentauglich

Wettbewerbsdruck: Apple, OpenAI und Anthropic geraten in Zugzwang

🎯 Was das für die Praxis bedeutet

Das könnte Sie auch interessieren

Google I/O Vorschau: Gemini Spark soll mit eigenem KI-Agenten Codex und Cowork angreifen

Gemini 3.1 Pro: Google übernimmt die Benchmark-Krone

Gemma 4: Googles On-Device Offensive gegen Meta und Qwen

Gemini 3.1 Flash Live: Googles Echtzeit-KI versteht Emotionen beim Sprechen

Gemini Omni: Googles Alleskönner versteht und erzeugt Video, Bild und Audio

Fehler melden

Die KI Woche als App