Mistral AI hat OCR 4 vorgestellt - ein spezialisiertes Modell für Dokumentenverarbeitung, das laut Mistral in 170 Sprachen arbeitet, Bounding Boxes liefert und auch selbst gehostet werden kann. In einem Blindtest mit über 600 Dokumenten in mehr als zwölf Sprachen bevorzugten unabhängige Bewerter OCR 4 gegenüber allen getesteten Systemen - mit einer durchschnittlichen Gewinnrate von 72 Prozent.
Handschrift, Formeln, historische Manuskripte
Was OCR 4 von klassischer Texterkennung unterscheidet, zeigt sich an den Randfällen. Ein Nutzer ließ das Modell einen handgeschriebenen Brief von Henri Poincaré aus dem Jahr 1905 lesen - die Art von Dokument, an der OCR-Systeme normalerweise scheitern. Ergebnis: Das Modell hielt stand.
Ein zweiter Test ging noch weiter: Eine handgeschriebene Matheprüfung wurde in sauberes LaTeX umgewandelt - samt korrekter Formeln, in 5,1 Sekunden, für 0,09 Dollar. Wenn das reproduzierbar ist, wird Dokumentendigitalisierung für Universitäten, Archive und Kanzleien spürbar günstiger.
Die Bildsprache sagt mehr als die Benchmarks
In der offiziellen Video-Präsentation fällt ein Detail auf: Für die Ankündigung wählt das französische KI-Unternehmen nicht den Ausblick auf Paris - sondern den auf San Francisco. Ein Zeichen dafür, wo Mistral seinen eigentlichen Markt und seine Konkurrenz verortet.
Konkurrenz aus China: Baidu liest ganze Bücher
Mistral ist nicht allein. Nahezu zeitgleich hat Baidu mit Unlimited-OCR ein Modell veröffentlicht, das laut Ankündigung ein ganzes Buch in einem Durchgang transkribieren kann. Wo die meisten Vision-Modelle Seite für Seite lesen und dabei den Kontext verlieren, soll Unlimited-OCR über beliebig viele Seiten hinweg konsistent bleiben. Wer Dokumenten-KI evaluiert, hat plötzlich zwei neue Optionen auf dem Tisch.
🎯 Was das für die Praxis bedeutet
1. Dokumentenarchive digitalisieren: 170 Sprachen, Handschrifterkennung und LaTeX-Export öffnen OCR 4 für Anwendungsfälle, die bisher manuelle Transkription erforderten - von historischen Archiven über handschriftliche Patientenakten bis zu Notariatsdokumenten.
2. Self-Hosting als Argument: Für Kanzleien, Behörden und Unternehmen mit strengen Datenschutzanforderungen ist die Option, OCR 4 lokal zu betreiben, ein entscheidender Unterschied zu rein cloudbasierten Alternativen.
3. Kosten prüfen: 0,09 Dollar pro Seite mit Formelextraktion ist eine Hausnummer. Wer heute manuelle Transkriptionsdienste bezahlt, sollte einen Vergleichstest mit OCR 4 einplanen.


