🖥️ Hardware & Infrastruktur Standard

OCR (Optical Character Recognition)

Optical Character Recognition (OCR) ist die Technologie zur Umwandlung von Bildern, die Text enthalten (z.B. Scans von Dokumenten, Fotos von Schildern, PDFs), in maschinenlesbaren und bearbeitbaren Text (ASCII/Unicode). Was für Menschen trivial erscheint ('Das ist ein A'), ist für Computer schwierig, da Buchstaben in unzähligen Schriftarten, Größen und Verzerrungen auftreten können. Klassische OCR arbeitete mit Mustervergleich. Moderne 'Deep OCR'-Systeme nutzen Convolutional Neural Networks (CNNs) und Recurrent Neural Networks (RNNs/Transformer), um nicht nur einzelne Zeichen zu erkennen, sondern ganze Wörter und Sätze im Kontext zu lesen. Dies ermöglicht auch die Erkennung von Handschriften und komplexen Layouts mit hoher Präzision.

Quellen & Referenzen

Google Cloud MLOps Best Practices
NVIDIA Developer Documentation

Vision Text

Aktuell

Aktuell

Aktuell

Aktuell

Aktuell

Die KI Woche — Podcast Show

Markus M. Kirchmair

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

OCR (Optical Character Recognition)

Quellen & Referenzen

Die KI Woche als App

Podcast Show

KI-Videos

KI-Events

KI-Tools

KI-Trainings

KI-Lexikon

KI Disruption

Die KI-Bibel

JOB ANGST

KI für Einsteiger

OCR (Optical Character Recognition)

Quellen & Referenzen

Verwandte Begriffe

Fehler melden

Die KI Woche als App