Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core support tool > Einführung in das agorum core support tool > agorum core ocr engine
Über den agorum core ocr tuner nehmen Sie diverse Einstellungen vor, um etwa dem System die Unterscheidung zwischen Hintergrund und Textfarbe auf Dokumenten zu erleichtern und die Qualität der OCR-Erkennung bei regelmäßig eingehenden Dokumenten zu verbessern.
Der agorum core ocr tuner ist Bestandteil der agorum core ocr engine und muss nicht separat installiert werden.
Hinweis: Die agorum core ocr engine wird nur in Verbindung mit einer agorum core pro-Lizenz unterstützt.
Im Blog Texterkennung verbessern mit dem agorum® core OCR-Tuner finden Sie diverse Anwendungsfälle.
Um der OCR-Engine mitzuteilen, dass sie den Kontrast erhöhen oder die Engine versuchen soll, vertikale / horizontale Linien zu entfernen, müssen Sie bestimmte Parameter setzen. Bevor Sie diese Parameter setzen, müssen Sie die besten Werte mithilfe des OCR-Tuners ermitteln.
<Installationsverzeichnis>\agorum core DocumentServer\iDRS\bin\OCRTuner.exe
Besondere Menüpunkte und Oberflächen des agorum core ocr tuners
Menüpunkt | Beschreibung |
---|---|
export | Exportiert die geänderten Parameter in einem Fenster. Sie können die Parameter markieren und in die Zwischenablage kopieren, um sie etwa in einer Aktiven-Ordner-Konfiguration einzufügen. |
run | Erzeugt ein neues Bild, um geänderte Parameter zu testen. |
OCR - Dropdown - Liste | OCR (Standard) Liest alles aus, was die OCR-Engine erkennen kann. Barcode Liest nur Barcodes aus. Handprint (Free) Liest nur Handschrift aus. Handprint (Boxed) Liest nur die in Boxen eingetragene Handschrift aus. |
Feld mit Parametern | Listet einstellbare Parameter auf. Klicken Sie zum Ändern eines Parameters mit der Maus rechts neben einen Parameter. |
Unterhalb des Felds mit Parametern | Listet Parameter auf, auf dem der Cursor steht. |
Unter Auflistung des aktuellen Parameters | Gibt den von der OCR-Engine gefundenen Text aus. Die Position des Textes auf der eingelesenen Seite wird nicht angegeben. |
Rechtes Fenster | Stellt eine Seite der aktuellen Datei dar.
|
Parameter | Beschreibung | Mögliche Werte |
---|---|---|
AdaptiveBinarization Parameter-Name: bitonal-auto |
siehe Spalte Mögliche Werte | true Die Umwandlung geschieht adaptiv für mehrere Bereiche des Dokuments. false Die Schwarz/Weiß-Wandlung wird auf das gesamte Dokument gleichförmig angewandt. Über die folgenden Parameter können weitere Einstellungen vorgenommen werden. |
BinarizationBrightness Parameter-Name: bitonal-brightness |
Bestimmt die Helligkeit. Gilt nur, wenn der Parameter AdaptiveBinarization auf true steht. |
0 bis 100 |
BinarizationContrast Parameter-Name: bitonal-contrast |
Bestimmt den Kontrast. Gilt nur, wenn der Parameter AdaptiveBinarization auf true steht. |
0 bis 100 |
BinarizationSmoothingLevel Parameter-Name: bitonal-smooth-level |
Bestimmt die Glättung ausgefranster Zeichen vor Schwarz-Weiß-Wandlung. Gilt nur, wenn der Parameter AdaptiveBinarization auf false steht. |
0 bis xxxx |
BinarizationThreshold Parameter-Name: bitonal-threshold |
Definiert die Binärisierungsschwelle. |
0 bis 255 0 = Aus Höherer Wert = schwärzeres Ergebnis |
BarcodeTypes Parameter-Name: barcode-types |
Listet verfügbare Barcodetypen auf. Eine Reduzierung der Typen steigert die Verarbeitungsgeschwindigkeit. |
Auswahl durch Entfernung des # Symbols vor dem Typ. Zuvor muss der Standard deaktiviert werden mit #all. Standard all = alle Barcodetypen außer Datamatrix |
CreatePdfOutput Parameter-Name: create-pdf-output |
siehe Spalte Mögliche Werte
Hinweis: Der Parameter im OCR-Tuner hat keine Auswirkungen, sondern dient nur als Information, um diese beim Export der Parameter angezeigt zu bekommen. |
true Erzeugt eine PDF-Datei mit der Ausgabe. false (Standard) Erzeugt keine PDF-Datei mit der Ausgabe. |
Deskew Parameter-Name: deskew |
siehe Spalte Mögliche Werte | true Dreht schief eingescannte Dokumente. false Dreht keine schief eingescannten Dokumente. |
Despeckle Parameter-Name: despeckle |
siehe Spalte Mögliche Werte | true Entfernt Verschmutzungen. false Entfernt keine Verschmutzungen. |
DespeckleDilate Parameter-Name: despeckle-dilate |
Bestimmt die Streuung der Verschmutzung in Pixel. Gilt nur, wenn der Parameter DespeckleDilate auf true steht. |
0 bis xxxx |
DespeckleSize Parameter-Name: barcode-size |
Bestimmt die Größe der Verschmutzung in Pixel. Gilt nur, wenn der Parameter DespeckleDilate auf true steht. |
0 bis xxxx |
DetectOrientation Parameter-Name: detect-orientation |
siehe Spalte Mögliche Werte | true (Standard) Aktiviert die Erkennung der Seitenausrichtung. false Deaktiviert die Erkennung der Seitenausrichtung. |
EngineVersion | Bestimmt die Abwärtskompatibilität.
Hinweise:
|
1 Für Abwärtskompatibilitätszwecke gedacht, um Änderungen beim Update der OCR-Engine Version so minimal wie möglich zu halten. 2 (Standard) Empfohlen bei Neuinstallationen |
LimitCharacters | Definiert Zeichen, die die OCR-Engine erkennen soll. Gilt nur für OCR-Dropdown-Liste-Handprint. |
0 bis xxxx Beispiel 1234567890 = nur Zahlen erkennen |
PdfOutputBookmarks Parameter-Name: pdf-output-bookmarks |
siehe Spalte Mögliche Werte
Hinweis: Der Parameter im OCR-Tuner hat keine Auswirkungen, sondern dient nur als Information, um diese beim Export der Parameter angezeigt zu bekommen. |
true (Standard) Schreibt Bookmarks beim Erzeugen der PDF-Datei. false Schreibt keine Bookmarks beim Erzeugen der PDF-Datei. |
Performlineremoval Parameter-Name: perform-line-removal |
siehe Spalte Mögliche Werte
Hinweis: Wenn dieser Parameter aktiviert ist, müssen alle Werte (horizontale und vertikale) belegt werden (!= 0), die dafür notwendig sind. Ansonsten funktioniert das Ausblenden im OCR innerhalb von agorum core nicht, sondern nur im OCR-Tuner.
|
true Blendet horizontale und vertikale Linien aus. false Blendet horizontale und vertikale Linien ein. |
LineRemovalHMax Parameter-Name: lr-horiz-maxthick |
Bestimmt die maximale Länge einer auszublendenden horizontalen Linie in Pixel. Gilt nur, wenn der Parameter Performlineremoval auf true steht. |
0 bis xxxx Empfohlener Wert 100 |
LineRemovalHMin Parameter-Name: lr-horiz-minlength |
Bestimmt die minimale Länge einer auszublendenden horizontalen Linie in Pixel. Gilt nur, wenn der Parameter Performlineremoval auf true steht. |
0 bis xxxx Empfohlener Wert 40 |
LineRemovalVMax Parameter-Name: lr-vertic-maxthick |
Bestimmt die maximale Länge einer auszublendenden vertikalen Linie in Pixel. Gilt nur, wenn der Parameter Performlineremoval auf true steht. |
0 bis xxxx Empfohlener Wert 100 |
LineRemovalVMin Parameter-Name: lr-vertic-minlength |
Bestimmt die minimale Länge einer auszublendenden vertikalen Linie in Pixel. Gilt nur, wenn der Parameter Performlineremoval auf true steht. |
0 bis xxxx Empfohlener Wert 40 |
RotatePage Parameter-Name: rotate-page |
Rotiert die Seite, sodass sie korrekt ausgerichtet wird, etwa bei 90,180 oder 270 Grad. | true (Standard) Aktiviert die korrekte Ausrichtung der Seite. false Deaktiviert korrekte Ausrichtung der Seite. |
Timeout Parameter-Name: timeout |
Definiert einen Time-out. Ist die Zeit verstrichen, bricht das Programm ab (in Millisekunden). | 0 bis xxxx Standard 86400000 (24h) |
use-bitonal-image:True | siehe Spalte Mögliche Werte | true Verwendet das von der OCR-Engine zur Erkennung der Texte benutzte Image als Preview. false (Standard) Gibt das Preview der OCR-Engine mit den Standard-Parametern zurück. |
WorkDepth | Definiert, wie genau die OCR-Erkennung arbeiten soll. | 0 bis 255 (höherer Wert = präziseres Ergebnis, jedoch langsamere Verarbeitung) Standard 100 |
languages | Definiert, welche Sprachen das System zur OCR-Erkennung verwendet.
Hinweis: Welche Sprachen möglich sind, zeigt der OCR-Tuner an. Die asiatische oder kyrillische Sprache steht nicht zur Verfügung. |
Auswahl durch Entfernung des #-Symbols vor der Sprache. Standard languages:English+French+German |
So gehen Sie vor, um die aufgeführten Parameter für den OCR-Tuner global für Ihre agorum core-Installation anzupassen (hier am Beispiel des Parameters EngineVersion):
MAIN_MODULE_MANAGEMENT/documentservice/control/services/settings/
--engine-version:2 ODER --engine-version=2
--<Parameter>:<Parameterwert> ODER --<Parameter>=<Parameterwert>
Damit die Problemdokumente im Produktivsystem erfolgreich ausgelesen werden können, benötigen Sie einen separaten Aktiven Ordner, der sich nur auf diese Dokumente bezieht.
Sobald Sie den Aktiven Ordner erstellt haben, fügen Sie die Parameter in das Feld Zusätzliche Parameter ein. Sie können alle Parameter zeilenweise angeben, die oben in der Tabelle beschrieben sind.
Als Schreibweise pro Parameter gilt:
--<Parameter>:<Parameterwert> ODER --<Parameter>=<Parameterwert>
Beispiel für eine Parameterangabe für einen Aktiven Ordner
Hinweis: Trennt agorum core docform Dokumente und überträgt sie in einen weiteren agorum core docform-Ordner, führt das System keine erneute OCR-Erkennung durch. Es gelten immer noch die Parameter des Trenn-Ordners.
Hinweis: Wenn Sie eine globale Einstellung im OCR-Tuner oder in der MetaDB vornehmen und gleichzeitig den Parameter mit einem anderen Wert im Aktiven Order setzen, hat die Einstellung im Aktiven Ordner Vorrang.
Wurde ein Dokument erfolgreich ausgelesen, aber ein Wert durch die OCR-Engine nicht erkannt, verwenden Sie den OCR-Tuner, um nur für diesen einen Bereich die optimalen OCR-Einstellungen zu finden.
Hinweis: Die Einstellungen greifen für alle Dokumente, die keine Textinformationen enthalten, und auch auf das gesamte Dokument.