Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core docform
In dieser Dokumentation finden Sie Probleme und Lösungen sowie Tipps im Umgang mit agorum core docform.
Probleme und Lösungen zu weiteren docform-Modulen finden Sie unter:
Sind bereits trainierte Dokumente nicht mehr auslesbar, überprüfen Sie, ob sich das Layout verändert hat, oder überprüfen Sie:
Das per OCR eingelesene Dokument enthält keine Dokumentinformationen und lässt sich im Training nicht mit der Maus markieren.
Die Datei ist zu groß, damit das System sie korrekt einlesen kann. Im Standard sind maximal 20971520 Byte als Dateigröße möglich, um das System vor einem Out-Of-Memory-Fehler zu schützen.
Modul „agorum core docform split“ verwenden (empfohlen)
Verwenden Sie agorum core docform split (siehe Dokumente trennen), teilt das Modul Ihr PDF-Dokument in einzelne Seiten auf.
Maximale Dateigröße erhöhen
Verändern Sie im agorum core support tool den Wert des Parameters maxDocSize, indem Sie den Wert des Parameters Schritt für Schritt erhöhen und die Auswirkung prüfen.
Die Fehlermeldung Could not save definition .. unable to create definition file taucht im Training auf.
Training mit gleichem Namen existiert bereits
Benutzer sind für agorum core docform falsch berechtigt
Die Fehlermeldung Could not run global object state machine taucht auf.
Metadaten wurden neu angelegt und im Dokumententyp angepasst, aber nicht in den vorhandenen Trainings.
Wenn ein Dokument aus dem Trainingsmodus über den OK-Button gesichert wird, erscheint die im Titel stehende Fehlermeldung.
Bei langsamen Systemen kann es zu diesem Fehler kommen, wenn docform-Anwender mehrmals hintereinander auf den OK-Button klicken. Durch ein langsames System erhält man nämlich nicht immer eine entsprechende Rückmeldung und klickt daher gerne ein zweites, drittes… Mal.
Bitte achten Sie darauf, nur einmal auf den OK-Button zu klicken.
Hinweis: Diese Fehlermeldung erscheint im support tool im API-Bereich und nicht im docform-Abschnitt.
Die Meldung / Warnung Definition validation failed logged at: agorum.docform.data.document.Document.loadXml(Document.java:64) taucht in docform auf, wenn Sie eine Suche anlegen und darunter ein Metadatum auslesen.
Die Suche war nicht erfolgreich, und das System kann das Metadatum nicht auslesen.
Ignorieren Sie die Meldung, wenn Ihr Training so gewollt ist.
Das System kann die Metadaten nicht per JavaScript über metadata().load() ausgeben.
Folgende mögliche Fehlerquellen wurden bereits überprüft:
Die Positions-Metadaten sind als inherited (vererbt) in der yml-Datei hinterlegt. agorum core docform setzt ausschließlich nicht vererbte Metadaten.
Wenn docform mehr als ein auf das Dokument passende Training findet, kann das System den Trainingsstatus nicht verlassen. Das System weiß in diesem Falle nicht, welches Training zu verwenden ist, und kann keine Informationen auslesen.
Sie sehen unten links entsprechende Fehlermeldungen:
Manchmal bleibt ein Dokument ohne jegliche Informationen im Trainingsmodus liegen. Dann existiert der gewählte Dokumententyp nicht mehr, weil er umbenannt wurde.
Hinweis: Sollten Sie auf Dokumententypen stoßen, die genauso heißen wie im Training, aber in der aufklappbaren Typ-Auswahl nicht markiert sind, kopieren Sie hier die Namen des Trainings und des realen Dokumententyps in Notepad++. So können Sie erkennen, ob Leerzeichen und Sonderleerzeichen hinzugefügt worden sind. Normale Leerzeichen stellt das Programm durch einen kleinen roten Punkt dar. Dem Sonderleerzeichen fehlen diese Punkte. Diese müssen Sie bereinigen und ein normales Leerzeichen einfügen.
Dieser Fehler tritt etwa auf, wenn Benutzer während des Trainings ihren Dokumententypen aus Word oder ähnlichen Programmen herauskopiert haben. Dadurch werden manchmal Sonderzeichen eingebaut, etwa Leerzeichen und Sonderleerzeichen.
Sie möchten E-Mails per docform auslesen und ablegen. In docform können Sie jedoch keinen Text in der E-Mail markieren.
Die Einstellung im Aktiven Ordner ist nicht korrekt.
docform erkennt Dokumente zu spät oder wendet Trainings zu spät an.
Prüfen Sie in diesem Falle zuerst im agorum core support tool, welche Trainings und Dokumente betroffen sind:
Hinweis: Die Meldung xxxx milliseconds elapsed while matching document against definition xxxxx, trying to abort... erscheint erst, wenn docform länger als 60 Sekunden benötigt, um ein Dokument oder Training zu laden. Sie können diese Laufzeit in der MetaDB unter folgendem Schlüssel anpassen:
MAIN_MODULE_MANAGEMENT/docform/control/MaxMatchTime
Geben Sie den Wert in Millisekunden an.
Erkennungsmerkmale (Identifizierungselemente) greifen nicht nur für die erste Seite, sondern für mehrere
Idents dienen der Identifizierung von Dokumenten. Dadurch stellen Sie sicher, dass docform das korrekte Training für die eingehenden Dokumente verwendet. Dabei stehen Idents immer auf der ersten Seite eines Dokuments. Ein Ident, der auf anderer Seite steht, ist nicht ideal und verlangsamt den Erkennungsprozess.
Auslese- und Suchelemente stehen auf derselben Ebene wie Identifizierungspunkte
Auslesekästchen und Suchelemente dürfen nicht auf derselben Ebene stehen wie Idents.
docform arbeitet diesen Baum von oben nach unten ab und versucht daher auch bei unpassenden Dokumenten bereits Werte auszulesen.
Diese Auslese-/Suchelemente sollten daher als Letztes ausgelesen werden und verschachtelt dem letzten Ident vorliegen.
Um Positionen auszulesen, werden mehrere Positionsanker eingesetzt:
Hinweis: Um verschachtelte Positionen in der Vergangenheit auszulesen, wurde die Taktik der verschachtelten Positionen verwendet. Verwenden Sie diese nicht, da dies ebenfalls zu einer unnötigen Verlangsamung des Erkennungsprozesses von docform führt.
Zum korrekten Trainieren von Dokumenten mit verschachtelten Positionen siehe Verschachtelte Positionen auslesen.
Wird ein Dokument in docform abgelegt, erscheint der Definitionsassistent, weil docform anscheinend kein passendes Training findet. Das Training ist jedoch vorhanden (erkennbar daran, wenn Sie das Dokument über die Kontextmenü-Aktion neu erkennen lassen).
Im Aktiven Ordner ist der Parameter Typ gesetzt. Dadurch greifen im ersten Schritt nur Trainings, die zum eingetragenen Dokumententypen passen. Wird das Dokument neu erkannt, ignoriert docform die Einstellung des Aktiven Ordners und gleicht alle vorliegenden Trainings ab.
Läuft die OCR auf einem Linux-System, können „OCR Zombies“ auflaufen und die OCR-Verarbeitung blockieren. Das liegt daran, dass agorum core wenige Threads einsetzt, um die OCR anzustoßen. Sind diese Threads noch blockiert, weil sie auf ein Ende von ReadIris warten, steht der docform-Prozess.
Sie möchten Dokumente mit QR-Codes per docform auslesen. Die Dokumente werden richtig erkannt, aber nicht die darin enthaltenen QR-Codes. Die QR-Codes auf den Originaldokumenten werden mit einem mobilen OCR-Scanner oder einem QR-Code-Scanner richtig erkannt.
Wenn auch die Überprüfung des dazugehörigen Trainings keine Verbesserung bringt, ist vermutlich die Scan-Qualität nicht ausreichend. Das ist nicht immer sichtbar, weil die OCR-Engine die Dokumente auf Pixelebene liest. Dadurch können Texte richtig erkannt und gleichzeitig QR-Codes nicht richtig ausgelesen werden.
Hinweis: Selten ist es möglich, dass QR-Codes auch mit angepassten Einstellungen nicht richtig erkannt werden. Prüfen Sie in diesem Fall mit dem Ersteller des Dokuments, ob die Druckqualität bei der Erstellung des Dokuments verbessert werden kann.
Beim Bearbeiten oder Speichern von agorum core pro-Inhalten, erhalten Sie die o.g. Fehlermeldung, zum Beispiel beim Abspeichern von docform-Trainings.
Sie haben über Ihre agorum core pro-Version ein agorum core open-Update eingespielt. Die agorum core pro-Inhalte werden hierbei nicht aktualisiert. So entsteht eine Inkonsistenz zwischen den agorum core-Modulen, die zu fehlerhaftem Verhalten führen kann.
Hinweis: Verwenden Sie für das Update auf agorum core pro mindestens die agorum core-Version, die dem verwendeten agorum core open-Update entspricht.