Modelle & Agenten

02. Apr

Modelle & Agenten

Alignment Whack-a-Mole:
Finetuning lässt LLMs ganze Bücher wörtlich reproduzieren

GPT-4o, Gemini-2.5-Pro und DeepSeek-V3.1 geben nach simplem Finetuning bis zu 90% geschützter Bücher wörtlich wieder. Drei Anbieter, dasselbe Problem.

KA

Kai

· 02. Apr. 2026 · 3 Min. Lesezeit

01. Apr

Modelle & Agenten

GLM-5V-Turbo: Zhipus Vision-Coding-Modell verwandelt Skizzen in Code

Das neue multimodale Modell versteht Screenshots, Designentwürfe und Videos — und generiert daraus direkt funktionale Frontends. Benchmark-Werte über Claude Opus 4.5.

KA

Kai

· 01. Apr. 2026 · 2 Min. Lesezeit

31. Mär

Modelle & Agenten

Microsoft Researcher:
Critique und Council bringen Multi-Modell-Intelligenz ins Büro

Zwei KI-Modelle prüfen sich gegenseitig — Microsofts neues Researcher-System übertrifft alle Einzelmodell-Ansätze auf dem DRACO-Benchmark um 7 Punkte.

KA

Kai

· 31. März 2026 · 4 Min. Lesezeit

29. Mär

Modelle & Agenten

David Silver: Eine Milliarde Dollar für Superintelligenz ohne Sprachmodelle

DeepMind-Veteran gründet Ineffable Intelligence in London und holt die größte Seed-Runde der europäischen Startup-Geschichte. Sein Ansatz: Reinforcement Learning statt LLMs.

KA

Kai

· 29. März 2026 · 5 Min. Lesezeit

29. Mär

Modelle & Agenten

Software-Agenturen wie Anwaltskanzleien:
Das Kanzlei-Modell für die KI-Ära

Entwickler-Veteran Ran Aroussi schlägt ein radikal neues Organisationsmodell vor: Architekten steuern KI-Agenten-Flotten, die Firma liefert Marke und Infrastruktur — wie bei Kirkland & Ellis.

KA

Kai

· 29. März 2026 · 6 Min. Lesezeit

29. Mär

Modelle & Agenten

McKinsey: Das Organigramm stirbt — willkommen in der agentischen Organisation

Acht McKinsey-Berater beschreiben den größten Paradigmenwechsel seit der Industrialisierung: Kleine Teams steuern Dutzende KI-Agenten, klassische Hierarchien weichen agentischen Netzwerken.

KA

Kai

· 29. März 2026 · 4 Min. Lesezeit

28. Mär

Modelle & Agenten

Nadella: Software wird zur Datenbank — KI-Agenten übernehmen die Intelligenz

Im BG2-Podcast beschreibt Microsofts CEO eine Zukunft, in der Apps nur noch CRUD-Systeme sind. Die Geschäftslogik wandert komplett zum KI-Agenten.

KA

Kai

· 28. März 2026 · 4 Min. Lesezeit

28. Mär

Modelle & Agenten

Google-Paper: Die KI-Singularität ist eine Gesellschaft, kein Superhirn

Forscher von Google, UChicago und UCSD zeigen: Reasoning-Modelle wie DeepSeek-R1 entwickeln spontan interne Debatten. Die nächste Intelligenzexplosion wird sozial, nicht monolithisch.

KA

Kai

· 28. März 2026 · 4 Min. Lesezeit

27. Mär

Modelle & Agenten

Gemini 3.1 Flash Live:
Googles Echtzeit-KI versteht Emotionen beim Sprechen

Sub-Sekunden-Latenz und über 90 Sprachen — das neue Modell hört nicht nur zu sondern erkennt Frustration und Tonfall. Ab 0,5 Cent pro Minute im Developer-Preview.

KA

Kai

· 27. März 2026 · 2 Min. Lesezeit

26. Mär

Modelle & Agenten

Vibe Coding XR: Google macht Mixed-Reality-Apps per Sprachbefehl möglich

Ein Prompt, 60 Sekunden, eine fertige Android-XR-App: Googles Vibe Coding XR kombiniert Gemini mit dem Open-Source-Framework XR Blocks — und senkt die Schwelle für räumliches Computing radikal.

KA

Kai

· 26. März 2026 · 2 Min. Lesezeit

26. Mär

Modelle & Agenten

ARC-AGI-3: Der Benchmark, an dem jede KI scheitert

Menschen lösen ihn zu 100 Prozent, die besten KI-Modelle schaffen weniger als 1 Prozent. ARC-AGI-3 misst, was kein anderer Benchmark misst: echte Abstraktionsfähigkeit.

KA

Kai

· 26. März 2026 · 3 Min. Lesezeit

25. Mär

Modelle & Agenten

MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht

Mit 8 Milliarden Parametern erreicht MolmoWeb 78 Prozent auf WebVoyager — mit Test-Time Scaling sogar 95 Prozent. Allen AI veröffentlicht Modell, Dataset und Training komplett offen.

KA

Kai

· 25. März 2026 · 2 Min. Lesezeit

25. Mär

Modelle & Agenten

AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität

Das Modul von UC Berkeley und NVIDIA entfernt redundante Video-Patches, bevor sie den Vision Transformer erreichen. Ergebnis: 19-facher Speedup und erstmals 4K-Videos mit 1.000 Frames in MLLMs.

KA

Kai

· 25. März 2026 · 2 Min. Lesezeit

25. Mär

Modelle & Agenten

HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle

75 Web-Komponenten, 37 Native-Komponenten, Tailwind CSS v4, CSS-only Animationen und ein MCP-Server für KI-Agenten — HeroUI liefert das umfassendste Update seiner Geschichte.

KA

Kai

· 25. März 2026 · 2 Min. Lesezeit

25. Mär

Modelle & Agenten

Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen

Die neue Plattform orchestriert mehrere KI-Agenten parallel — Code, Bilder, 3D-Modelle und Daten gleichzeitig. Was Stunden dauerte, soll in Sekunden erledigt sein.

KA

Kai

· 25. März 2026 · 2 Min. Lesezeit

25. Mär

Modelle & Agenten

Anthropic zeigt, wie Claude stundenlang autonom programmiert

Drei Agenten — Planer, Generator, Evaluator — arbeiten in Sprints an vollständigen Full-Stack-Apps. Anthropic teilt die Engineering-Details des Harness-Designs, das Claude zum autonomen Software-Entwickler macht.

KA

Kai

· 25. März 2026 · 2 Min. Lesezeit

25. Mär

Modelle & Agenten

TurboQuant: Google komprimiert KI-Speicher sechsfach — bei null Genauigkeitsverlust

Der neue Algorithmus reduziert den Key-Value-Cache großer Sprachmodelle um das Sechsfache und beschleunigt die Verarbeitung auf H100-GPUs um das Achtfache. Ohne jedes Nachtraining.

KA

Kai

· 25. März 2026 · 3 Min. Lesezeit

24. Mär

Modelle & Agenten

Google NewFront: Gemini übernimmt die Werbeplattform

Google integriert Gemini-Modelle in die gesamte Marketing Platform — von proaktiver Mediakuratierung bis zum Kampagnen-Management per Prompt. Eine Circana-Studie meldet 76 Prozent mehr Rendite.

KA

Kai

· 24. März 2026 · 4 Min. Lesezeit

23. Mär

Modelle & Agenten

Claude übernimmt den Desktop:
Computer Use macht OpenClaw für viele überflüssig

Anthropics KI steuert jetzt Browser, Maus und Tastatur direkt — und lässt sich per Handy beauftragen. Die Kombination aus Dispatch und Computer Use ersetzt externe Agenten-Frameworks.

KA

Kai

· 23. März 2026 · 3 Min. Lesezeit

23. Mär

Modelle & Agenten

Gamma launcht AI-Native Templates:
Präsentationen per Prompt umbauen

Mit dem neuen Create-from-this-Button verwandelt Gamma bestehende Decks per Textbefehl in neue Versionen — inklusive 100+ professioneller Vorlagen.

KA

Kai

· 23. März 2026 · 2 Min. Lesezeit

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Alignment Whack-a-Mole:
Finetuning lässt LLMs ganze Bücher wörtlich reproduzieren

GLM-5V-Turbo: Zhipus Vision-Coding-Modell verwandelt Skizzen in Code

Microsoft Researcher:
Critique und Council bringen Multi-Modell-Intelligenz ins Büro

David Silver: Eine Milliarde Dollar für Superintelligenz ohne Sprachmodelle

Software-Agenturen wie Anwaltskanzleien:
Das Kanzlei-Modell für die KI-Ära

McKinsey: Das Organigramm stirbt — willkommen in der agentischen Organisation

Nadella: Software wird zur Datenbank — KI-Agenten übernehmen die Intelligenz

Google-Paper: Die KI-Singularität ist eine Gesellschaft, kein Superhirn

Gemini 3.1 Flash Live:
Googles Echtzeit-KI versteht Emotionen beim Sprechen

Vibe Coding XR: Google macht Mixed-Reality-Apps per Sprachbefehl möglich

ARC-AGI-3: Der Benchmark, an dem jede KI scheitert

MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht

AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität

HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle

Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen

Anthropic zeigt, wie Claude stundenlang autonom programmiert

TurboQuant: Google komprimiert KI-Speicher sechsfach — bei null Genauigkeitsverlust

Google NewFront: Gemini übernimmt die Werbeplattform

Claude übernimmt den Desktop:
Computer Use macht OpenClaw für viele überflüssig

Gamma launcht AI-Native Templates:
Präsentationen per Prompt umbauen

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Modelle & Agenten

Alignment Whack-a-Mole:Finetuning lässt LLMs ganze Bücher wörtlich reproduzieren

GLM-5V-Turbo: Zhipus Vision-Coding-Modell verwandelt Skizzen in Code

Microsoft Researcher:Critique und Council bringen Multi-Modell-Intelligenz ins Büro

David Silver: Eine Milliarde Dollar für Superintelligenz ohne Sprachmodelle

Software-Agenturen wie Anwaltskanzleien:Das Kanzlei-Modell für die KI-Ära

McKinsey: Das Organigramm stirbt — willkommen in der agentischen Organisation

Nadella: Software wird zur Datenbank — KI-Agenten übernehmen die Intelligenz

Google-Paper: Die KI-Singularität ist eine Gesellschaft, kein Superhirn

Gemini 3.1 Flash Live:Googles Echtzeit-KI versteht Emotionen beim Sprechen

Vibe Coding XR: Google macht Mixed-Reality-Apps per Sprachbefehl möglich

ARC-AGI-3: Der Benchmark, an dem jede KI scheitert

MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht

AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität

HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle

Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen

Anthropic zeigt, wie Claude stundenlang autonom programmiert

TurboQuant: Google komprimiert KI-Speicher sechsfach — bei null Genauigkeitsverlust

Google NewFront: Gemini übernimmt die Werbeplattform

Claude übernimmt den Desktop:Computer Use macht OpenClaw für viele überflüssig

Gamma launcht AI-Native Templates:Präsentationen per Prompt umbauen

Fehler melden

Die KI Woche als App

Alignment Whack-a-Mole:
Finetuning lässt LLMs ganze Bücher wörtlich reproduzieren

Microsoft Researcher:
Critique und Council bringen Multi-Modell-Intelligenz ins Büro

Software-Agenturen wie Anwaltskanzleien:
Das Kanzlei-Modell für die KI-Ära

Gemini 3.1 Flash Live:
Googles Echtzeit-KI versteht Emotionen beim Sprechen

Claude übernimmt den Desktop:
Computer Use macht OpenClaw für viele überflüssig

Gamma launcht AI-Native Templates:
Präsentationen per Prompt umbauen