Das Pariser KI-Startup H Company hat mit Holo3 ein Open-Source-Modell vorgestellt, das auf dem OSWorld-Verified-Benchmark - dem führenden Test für die autonome Bedienung von Desktop-Software - mit 78,9 Prozent einen neuen Bestwert setzt. Zum Vergleich: GPT-5.4 und Claude Opus 4.6 liegen nach Herstellerangaben darunter. Das Besondere: Holo3 arbeitet mit nur 10 Milliarden aktiven Parametern (122 Mrd. total) - und kostet damit laut H Company rund ein Zehntel dessen, was die großen proprietären Modelle verlangen.
Holo3 ist kein klassisches Chatbot-Modell, sondern ein sogenannter Computer-Use-Agent - also ein System, das eigenständig am Computer arbeiten kann: Webseiten navigieren, Formulare ausfüllen, Dateien verwalten und mehrstufige Workflows über verschiedene Anwendungen hinweg koordinieren. Das Unternehmen hat dafür einen eigenen Trainingsansatz entwickelt, den es „Agentic Learning Flywheel" nennt.
Synthetische Büroumgebungen als Trainingsparcours
Statt das Modell nur auf statischen Benchmarks zu trainieren, hat H Company eine sogenannte Synthetic Environment Factory aufgebaut: Coding-Agenten erstellen automatisch realistische Unternehmens-Websites und -Anwendungen, in denen Holo3 trainierte Aufgaben lösen muss. Die firmeneigene Benchmark-Suite „H Corporate Benchmarks" umfasst 486 mehrstufige Aufgaben in den Bereichen E-Commerce, Business-Software, Kollaboration und Multi-App-Szenarien.
Am anspruchsvollsten sind die Multi-App-Aufgaben: Ein Agent muss etwa Ausstattungspreise aus einem PDF abrufen, diese mit dem verbleibenden Budget jedes Mitarbeiters abgleichen und dann automatisch personalisierte Genehmigungs- oder Ablehnungs-E-Mails versenden - eine Aufgabe, die präzises Rechnen, Dokumentenverständnis und mehrstufiges Reasoning über mehrere Anwendungen erfordert.
Open Source und API-Zugang
Die kleinere Variante Holo3-35B-A3B ist als Open-Source-Modell unter Apache-2.0-Lizenz auf Hugging Face verfügbar. Für die größeren Varianten bietet H Company eine Inference-API an, die auch einen kostenlosen Zugang umfasst. Das Geschäftsmodell zielt auf Unternehmen, die KI-Agenten direkt in ihre Geschäftsprozesse integrieren wollen - nicht als Chatbot, sondern als autonomen digitalen Mitarbeiter.
🎯 Was das für die Praxis bedeutet
1. Computer-Use wird erschwinglich: Mit einem Zehntel der Kosten proprietärer Modelle wird die autonome Softwarebedienung durch KI auch für mittelständische Unternehmen wirtschaftlich interessant.
2. Open Source für Agenten testen: Holo3-35B ist frei verfügbar und kann intern evaluiert werden - ein guter Ausgangspunkt, um zu prüfen, ob KI-Agenten wiederkehrende Büroaufgaben tatsächlich zuverlässig übernehmen können.
3. Benchmark-Werte einordnen: OSWorld misst strukturierte Desktop-Aufgaben unter kontrollierten Bedingungen. Produktionseinsätze sind komplexer. Die Benchmark-Führung ist ein Signal, kein Praxisbeweis.