Modelle & Agenten

Holo3: Open-Source-Agent schlägt GPT 5.4 bei einem Zehntel der Kosten

Das Pariser Startup H Company setzt mit 78,9% auf dem OSWorld-Benchmark einen neuen Bestwert — mit nur 10 Milliarden aktiven Parametern.

Kai · 02. Apr. 2026 · 2 Min. Lesezeit

Das Pariser KI-Startup H Company hat mit Holo3 ein Open-Source-Modell vorgestellt, das auf dem OSWorld-Verified-Benchmark - dem führenden Test für die autonome Bedienung von Desktop-Software - mit 78,9 Prozent einen neuen Bestwert setzt. Zum Vergleich: GPT-5.4 und Claude Opus 4.6 liegen nach Herstellerangaben darunter. Das Besondere: Holo3 arbeitet mit nur 10 Milliarden aktiven Parametern (122 Mrd. total) - und kostet damit laut H Company rund ein Zehntel dessen, was die großen proprietären Modelle verlangen.

Holo3 ist kein klassisches Chatbot-Modell, sondern ein sogenannter Computer-Use-Agent - also ein System, das eigenständig am Computer arbeiten kann: Webseiten navigieren, Formulare ausfüllen, Dateien verwalten und mehrstufige Workflows über verschiedene Anwendungen hinweg koordinieren. Das Unternehmen hat dafür einen eigenen Trainingsansatz entwickelt, den es „Agentic Learning Flywheel" nennt.

Synthetische Büroumgebungen als Trainingsparcours

Statt das Modell nur auf statischen Benchmarks zu trainieren, hat H Company eine sogenannte Synthetic Environment Factory aufgebaut: Coding-Agenten erstellen automatisch realistische Unternehmens-Websites und -Anwendungen, in denen Holo3 trainierte Aufgaben lösen muss. Die firmeneigene Benchmark-Suite „H Corporate Benchmarks" umfasst 486 mehrstufige Aufgaben in den Bereichen E-Commerce, Business-Software, Kollaboration und Multi-App-Szenarien.

Am anspruchsvollsten sind die Multi-App-Aufgaben: Ein Agent muss etwa Ausstattungspreise aus einem PDF abrufen, diese mit dem verbleibenden Budget jedes Mitarbeiters abgleichen und dann automatisch personalisierte Genehmigungs- oder Ablehnungs-E-Mails versenden - eine Aufgabe, die präzises Rechnen, Dokumentenverständnis und mehrstufiges Reasoning über mehrere Anwendungen erfordert.

Open Source und API-Zugang

Die kleinere Variante Holo3-35B-A3B ist als Open-Source-Modell unter Apache-2.0-Lizenz auf Hugging Face verfügbar. Für die größeren Varianten bietet H Company eine Inference-API an, die auch einen kostenlosen Zugang umfasst. Das Geschäftsmodell zielt auf Unternehmen, die KI-Agenten direkt in ihre Geschäftsprozesse integrieren wollen - nicht als Chatbot, sondern als autonomen digitalen Mitarbeiter.

🎯 Was das für die Praxis bedeutet

1. Computer-Use wird erschwinglich: Mit einem Zehntel der Kosten proprietärer Modelle wird die autonome Softwarebedienung durch KI auch für mittelständische Unternehmen wirtschaftlich interessant.

2. Open Source für Agenten testen: Holo3-35B ist frei verfügbar und kann intern evaluiert werden - ein guter Ausgangspunkt, um zu prüfen, ob KI-Agenten wiederkehrende Büroaufgaben tatsächlich zuverlässig übernehmen können.

3. Benchmark-Werte einordnen: OSWorld misst strukturierte Desktop-Aufgaben unter kontrollierten Bedingungen. Produktionseinsätze sind komplexer. Die Benchmark-Führung ist ein Signal, kein Praxisbeweis.

📰 Quellen

@hcompany_ai auf X ↗ H Company ↗

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Holo3: Open-Source-Agent schlägt GPT 5.4 bei einem Zehntel der Kosten

Synthetische Büroumgebungen als Trainingsparcours

Open Source und API-Zugang

🎯 Was das für die Praxis bedeutet

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

Holo3: Open-Source-Agent schlägt GPT 5.4 bei einem Zehntel der Kosten

Synthetische Büroumgebungen als Trainingsparcours

Open Source und API-Zugang

🎯 Was das für die Praxis bedeutet

Das könnte Sie auch interessieren

Grok 4.5: SpaceXAI und Cursor gelingt das günstigste Frontier-Coding-Modell

GPT-5.6 Sol startet Donnerstag - und Fable 5 bleibt die Nummer 1

Higgsfield Supercomputer kann jetzt Full-Stack-Apps und Spiele bauen

Fehler melden

Die KI Woche als App