A B C D E F G H I J K L M N O P R S T U V W

OCR (Optical Character Recognition)

OCR steht für Optical Character Recognition, auf Deutsch als optische Zeichenerkennung oder als Texterkennung bekannt. Eine OCR-Software kann auf einem digitalen Bild gedruckte Texte erkennen und diese dann in ein Text-Dokument umwandeln. Beim manuellen Abtippen eines Dokuments erfolgt diese „Umwandlung“ durch den Menschen vor dem Bildschirm.

OCR-Software ist erhältlich als PC-Software, kostenloses Online-Tool oder App für Smartphone und Tablet. Genauso sind inzwischen aber auch Drucker, Scanner oder andere Multifunktionsgeräte auf dem Markt verfügbar, die OCR-Software integriert haben. Die Wahl der richtigen Lösung hängt vom Scanvolumen und auch dem gewünschten Funktionsumfang ab, bspw. ob auch händisch geschriebene Texte erkannt werden sollen.

Vorteile von OCR

  • Beschleunigter Arbeitsablauf durch automatisierte Datenverarbeitung
  • Erhöhte Produktivität der Arbeitsabläufe
  • Geringeres Fehlerpotenzial als bei manueller Erfassung
  • Automatisierte Zuordnung von gescannten Dokumenten, Bildern, etc.
  • Erleichtertes Durchsuchen auch von Bildern

Grundlage für OCR

Grundlage für funktionierendes OCR ist vor allem Qualität des Originals / Dokuments. Diese sind beispielsweise Farbigkeit, Kontrast, Layout und die Schriftart. Zudem sollte es keine Falten, Flecken, Markierungen, Durchstreichungen oder Unterstreichungen enthalten. Bei einer händischen Fotografie des Dokuments sollte man auf gute Lichtverhältnisse achten und die Kamera ruhig und gerade über das Papier halten.

Wie funktioniert OCR?

  1. Dokumenterfassung: Die Seite wird durch Abfotografieren oder Einscannen erfasst und als Bilddatei (Rastergrafik) abgespeichert.
  2. Layoutanalyse der Software: Einzelteile wie bspw. Bilder, Grafiken oder Textblöcke und deren Platzierung werden erkannt. Alle Textblöcke werden automatisiert in Absätze, Sätze, Wörter und Zeichen aufgeteilt.
  3. Zeichenerkennung: In diesem Schritt werden Verfahren der Muster- sowie Merkmalserkennung genutzt. Die einzelnen erkannten Bildpunkte werden mit einer Datenbank von Mustern für Buchstaben / Zeichen und Computerschriftarten abgeglichen. Ein Algorithmus entscheidet, mit welchem Muster das Zeichen am ehesten übereinstimmt. Dann setzt die Software den erkannten Buchstaben, Ziffer oder Satzzeichen in einer üblichen Textcodierung wieder ein.
  4. Zusammensetzung des Texts: Im Folgeschritt werden die einzelnen Zeichen und Buchstaben wieder zu Wörtern und Sätzen kombiniert. Bestenfalls setzt die Software in diesem Schritt ein integriertes Wörterbuch und eine Rechtschreibkorrektur ein, sodass am Ende sinnvolle Sätze entstehen. So bauen sich nach und nach wieder gesamte Absätze und der komplette Text auf.
  5. Dokumentspeicherung: Am Ende speichert die Texterkennungs-Software die erkannten Texte in einer bearbeitbaren Datei.

Anwendungsbereiche / Beispiele von OCR

  • Erfassung der Adressen bei Postsendungen
  • Bilddateien weiterbearbeiten oder elektronisch durchsuchbar machen
  • Erkennung von Merkmalen zur elektronischen Einsortierung eines Schriftstücks
  • Identifizierung von KFZ-Zeichen in der Verkehrsüberwachung
  • Erweiterte Volltextsuche nach Inhalten (auch in pdfs und Bildern)
  • Unterstützung für Blinde mit Sprachausgabe
  • Scan in Apps (bspw. Rechnungs-Scan in der Banking-App)
  • Übersetzungs-App per Foto / Kamera-Funktion

Auch in der Transport Management Solution CarLo ist OCR für die Logistik und Transportdokumente implementiert. Mit der Funktion lassen sich beispielsweise Transportaufträge direkt aus PDF-Dateien auslesen und Aufträge vollautomatisch erfassen. Eine manuelle Erfassung ist somit nicht mehr erforderlich, wodurch Logistik- und Transportunternehmen eine enorme Zeiteinsparung verzeichnen können. Die eigens entwickelte OCR-Komponente unterstützt dabei Dokumente im PDF-Format und liest sogar Texte aus E-Maildateien aus.