Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter
Technologie

OCR (Optical Character Recognition)

Optical Character Recognition (OCR) ist die Technologie zur Umwandlung von Bildern, die Text enthalten (z.B. Scans von Dokumenten, Fotos von Schildern, PDFs), in maschinenlesbaren und bearbeitbaren Text (ASCII/Unicode). Was für Menschen trivial erscheint ('Das ist ein A'), ist für Computer schwierig, da Buchstaben in unzähligen Schriftarten, Größen und Verzerrungen auftreten können.

Klassische OCR arbeitete mit Mustervergleich. Moderne 'Deep OCR'-Systeme nutzen Convolutional Neural Networks (CNNs) und Recurrent Neural Networks (RNNs/Transformer), um nicht nur einzelne Zeichen zu erkennen, sondern ganze Wörter und Sätze im Kontext zu lesen. Dies ermöglicht auch die Erkennung von Handschriften und komplexen Layouts mit hoher Präzision.

Vision Text