OCR steht für Optical Character Recognition, zu Deutsch optische Zeichenerkennung. Dabei handelt es sich um eine Technologie, die es ermöglicht, gedruckten oder handschriftlichen Text in digitalen Formaten zu erkennen und zu verarbeiten. OCR wird in vielen Bereichen eingesetzt, wie zum Beispiel bei der Digitalisierung von Büchern, dem Scannen von Dokumenten oder der automatischen Texterkennung in Bildern.
Eine gute OCR-Engine ist die Voraussetzung für ein Dokumentenmanagement-System (DMS), um Dokumente digital zu verwalten. Die automatisierte Texterkennung durch die OCR-Engine liest alle Informationen eines Dokuments aus, um zum Beispiel Rechnungen digital zu verarbeiten oder E-Akten automatisiert durch das Unternehmen zu leiten. Alle Basics rund um die OCR-Engine im DMS agorum core beschreiben wir in diesem Beitrag.
Was ist eine OCR-Engine?
Eine OCR-Engine ist eine Softwarekomponente oder ein Algorithmus, der für die optische Zeichenerkennung (OCR) verwendet wird. Es handelt sich um den Kern einer OCR-Anwendung, der für die Texterkennung und -verarbeitung verantwortlich ist. Eine OCR-Engine besteht aus mehreren Modulen, die zusammenarbeiten, um gedruckten oder handschriftlichen Text in digitale Formate umzuwandeln. Zu den Hauptfunktionen einer OCR-Engine gehören:
Es gibt verschiedene OCR-Engines auf dem Markt, die sich in Bezug auf Leistung, Genauigkeit und Funktionalität unterscheiden können. Einige OCR-Engines sind als Standalone-Software verfügbar, während andere als Teil größerer OCR-Softwarepakete oder Cloud-Dienste angeboten werden. Die Wahl der passenden OCR-Engine hängt von den spezifischen Anforderungen des Projekts oder der Anwendung ab, wie zum Beispiel der Art des zu erkennenden Texts, der Genauigkeitsanforderungen oder der Skalierbarkeit. |
OCR: Die digitale Erfassung und Integration von Papierdokumenten ins DMS
Warum eine Texterkennung wichtig ist
Papierdokumente werden üblicherweise durchs Einscannen digitalisiert. Handelsübliche Scanner liefern als Ergebnis lediglich Bilddateien oder PDFs ohne inhaltliche Informationen. Für die digitale Verarbeitung von Dokumenten benötigt ein DMS aber den enthaltenen Text, um Metadaten zu vergeben und das Dokument für die Volltextsuche zu indizieren. Dafür ist die Texterkennung oder Optical Character Recognition, kurz OCR, notwendig. Diese ist entweder bereits im Scanner integriert oder arbeitet serverseitig wie die agorum core OCR-Engine.
Dokumente einfach auslesen mit dem DMS agorum core
Die Papierdokumente können einfach im Stapel eingescannt werden und laufen ohne Zusatzarbeit für Ihre Mitarbeiter automatisch durch die Server-OCR, die zudem nicht nur den Text erkennt, sondern auch viele weitere Merkmale, die für die automatische Weiterverarbeitung der Dokumente genutzt werden können.
Das Scannen an sich geht sehr viel schneller, weil der Mitarbeiter nur den Stapel Dokumente in den Scanner legen und auf “Start” drücken muss. Alles andere erledigt agorum core. An den Scanplätzen ist keine teure und / oder komplizierte Technik nötig, Sie können mit nahezu jedem Scanner arbeiten. Einzige Bedingung: Er muss in ein Netzlaufwerk schreiben können, aber das können heute fast alle handelsüblichen netzwerkfähigen Produkte. Außerdem folgt die Texterkennung immer den gleichen Regeln, egal, über welchen Scanner das Dokument ins DMS gelangt.
Was erfasst die agorum core OCR-Engine?
Wie oben bereits angesprochen, erfasst die agorum core OCR-Engine über den reinen Text hinaus weitere Informationen, die sehr nützlich sind, wenn Sie mehr mit Ihren Dokumenten machen möchten, als sie lediglich ablegen und für die Volltextsuche indizieren.
Ausgelesen werden können:
- Text
- Barcodes, z. B. Strichcodes oder QR-Codes
- Positionen von Texten
- Farben des Textes, Vordergrunds und Hintergrunds
- Schriftart, Zeichen- und Zeilenabstand
- Textauszeichnungen, z. B. fett, kursiv, unterstrichen
- Qualitätsmerkmal bei der Erkennung einzelner Zeichenketten
Eine XML-Datei ist der Schlüssel für die Weiterverarbeitung von Dokumenten
Die im Dokument erkannten und ausgelesenen Inhalte werden als XML-Datei ausgegeben, die wiederum als Grundlage dient, um die Dokumente mit agorum core docform automatisch zu erfassen und schnell und einfach in beliebige Workflows und Geschäftsprozesse zu integrieren.
Im Zusammenspiel mit agorum core docform ist die OCR-Engine also ein mächtiges Werkzeug für die automatisierte Dokumentenverarbeitung. Ein Beispiel: Eine Papierrechnung wird eingescannt, der OCR liest den enthaltenen Text und seine Positionen aus. Diese Informationen nutzt docform, um das Dokument zu klassifizieren und die nötigen Metadaten zu generieren, anhand derer das Dokument als Rechnung erkannt und in den entsprechenden Workflow geleitet werden kann. Detailliertere Informationen zur automatischen Rechnungsverarbeitung finden Sie in folgenden Blogbeiträgen:
Clevere OCR-Engine mit eingebauter Selbstkontrolle
Ein Feature, das unsere Kunden immer wieder begeistert
Sehr beliebt ist die in der agorum core OCR-Engine eingebaute Selbstkontrolle. Die Engine ist in der Lage, anhand diverser Kriterien selbst zu entscheiden, wie wahrscheinlich es ist, dass sie den Inhalt des Dokumentes richtig ausgelesen hat. Sie drückt dies in einer Qualitätskennzahl von 0 bis 100 aus: 0 bedeutet unsicher, 100 sehr sicher.
Je nach Qualität und Inhalt eines Dokumentes ist es gar nicht so einfach für die OCR-Engine, den Inhalt richtig zu erkennen, wenn ihr vorher keiner sagt, ob der erkannte senkrechte Strich ein großes I, ein kleines L, eine 1 oder einfach nur ein Strich ist. Ein “Kreis” kann je nach Zusammenhang ein O oder eine Null sein. Ein großes B, ein ß und eine 8 sind sich ebenfalls sehr ähnlich und stellen daher eine potenzielle Fehlerquelle für die Texterkennung dar, insbesondere, wenn das Ursprungsdokument beispielsweise ein schlechtes Fax ist.
Die Selbstkontrolle lässt sich sogar an individuelle Bedürfnisse anpassen
Steht beispielsweise die Qualitätskennzahl per Default auf 80, kann der Administrator diese Zahl für einzelne Zeichenketten, z. B. Rechnungsnummern, Kundennummern, Firmennamen o. Ä. mittels Schieberegler erhöhen oder verringern. Dokumente mit schlechterer Qualität als dem eingestellten Wert erscheinen automatisch im docform audit, und der zuständige Mitarbeiter kann der OCR-Engine “unter die Arme greifen” und die Zweifelsfälle manuell definieren. So vermeiden Sie Fehler, steigern die Qualität der automatischen Dokumentenerfassung und verbessern nebenbei die Datenqualität in Ihrem Unternehmen.
Mit der Funktion docform-Dokumententypen können Sie die Qualität der automatischen Texterkennung weiter steigern, indem Sie der OCR-Engine einfach vorher sagen, dass an dieser Stelle beispielsweise ein Datum stehen soll. Erkennt sie nun mit diesem Wissen eine etwas unscharfe Form, die theoretisch eine 8, ein B oder ein ß sein könnte, kann sie zweifelsfrei entscheiden, dass es eine 8 sein muss – denn ein B oder ß haben in einem Datum nichts zu suchen.
Was zeichnet ein gut lesbares Dokument aus?
Je besser die Qualität des Ursprungsdokumentes, umso fehlerfreier auch die ausgelesenen Daten. Um es der OCR-Engine so einfach wie möglich zu machen, den Inhalt eines Dokumentes richtig zu erkennen, wird das Ausgangsdokument am besten mit 300 dpi eingescannt. Die Dokumente können farbig oder auch als Graustufen eingelesen werden.
Für beste Ergebnisse sollten Dokumente gar nicht oder zumindest nur gering komprimiert werden. Je stärker die Komprimierung, desto mehr störende Artefakte entstehen, die die OCR-Engine irritieren und zu unklaren Ergebnissen führen können.
Mithilfe leistungsstarker, bildbasierter Verbesserungsinstrumente kann die agorum core OCR-Engine die Lesbarkeit von Dokumenten bereits vor der eigentlichen Texterkennung steigern.
Beispiele für Dokumente, die von der OCR-Engine nicht ausgelesen werden können, haben wir in diesem Beitrag beschrieben.
Technische Infos zur agorum core OCR-Engine
Die agorum core OCR-Engine basiert auf Readiris, das von Haus aus bereits eines der besten Texterkennungsprogramme auf dem Markt ist.
Die OCR-Engine können Sie sowohl auf einem Windows- als auch auf einem Linux-Betriebssystem installieren und benutzen - also dort, wo auch agorum core installiert ist.
Oliver Schulze | Geschäftsführer
Lernen Sie die Funktionalitäten kennen
Im Rahmen einer Online-Demo zeigen unsere DMS-Experten, welche Möglichkeiten der Dokumentenverarbeitung unser DMS agorum core bietet. Beliebte Themen sind die digitale Rechnungsverarbeitung, E-Akten, automatisierte Geschäftsprozesse, die revisionssichere Archivierung – um nur wenige zu nennen. Wir freuen uns auf Ihre Anfrage! Hier.