agorum core docform – Troubleshooting

In dieser Dokumentation finden Sie Probleme und Lösungen sowie Tipps im Umgang mit agorum core docform.

Probleme und Lösungen zu weiteren docform-Modulen finden Sie unter:

Allgemeine Probleme / Tipps zum Feintuning

Sind bereits trainierte Dokumente nicht mehr auslesbar, überprüfen Sie, ob sich das Layout verändert hat, oder überprüfen Sie:

Haben Sie die Qualität von Suchfeldern oder Identfeldern zu hoch eingestellt?
Steht ein Strichcode zu nah am Text?
Hat sich die Position des Strichcodes verändert?
Befinden sich Wasserzeichen und Schattierungen (etwa grau) auf dem Dokument? Verbessern Sie Dokumente per OCR Tuner.

Dokument kann nicht markiert werden / enthält keine Dokumentinformationen

Beschreibung des Problems

Das per OCR eingelesene Dokument enthält keine Dokumentinformationen und lässt sich im Training nicht mit der Maus markieren.

Ursache

Die Datei ist zu groß, damit das System sie korrekt einlesen kann. Im Standard sind maximal 20971520 Byte als Dateigröße möglich, um das System vor einem Out-Of-Memory-Fehler zu schützen.

Lösungen

Modul „agorum core docform split“ verwenden (empfohlen)

Verwenden Sie agorum core docform split (siehe Dokumente trennen), teilt das Modul Ihr PDF-Dokument in einzelne Seiten auf.

Haben Sie etwa ein PDF mit 20 Seiten, erzeugt agorum core docform split 20 PDFs mit einer Länge von einer Seite.
Das System reicht jede Seite an die OCR weiter.
Dank der geringeren Größe verarbeitet das System die Seiten problemlos.

Maximale Dateigröße erhöhen

Verändern Sie im agorum core support tool den Wert des Parameters maxDocSize, indem Sie den Wert des Parameters Schritt für Schritt erhöhen und die Auswirkung prüfen.

Could not save definition .. unable to create definition file

Beschreibung des Problems

Die Fehlermeldung Could not save definition .. unable to create definition file taucht im Training auf.

Ursachen

Ein Training mit dem gleichen Namen existiert bereits.
Benutzer sind für agorum core docform falsch berechtigt.

Lösungen

Training mit gleichem Namen existiert bereits

Löschen Sie das alte Training oder überarbeiten Sie dieses.

Benutzer sind für agorum core docform falsch berechtigt

Überprüfen Sie die Berechtigungen der Benutzer für agorum core docform.

Could not run global object state machine

Beschreibung des Problems

Die Fehlermeldung Could not run global object state machine taucht auf.

Ursache

Metadaten wurden neu angelegt und im Dokumententyp angepasst, aber nicht in den vorhandenen Trainings.

Lösung

Passen Sie jedes betroffene Training an.
Lesen Sie das neue Metadatum aus.
Prüfen Sie, ob der FileWorkflow oder ein daran anschließender Workflow ebenfalls eine Korrektur benötigt.

Could not run global object state machine (Handler threw exception: agorum.docform.worker.robot.handlers.Audit (An exception occurred while running a robot handler (No entry found for ID 'XXXX' in select select Creator, CREATeDate, CLASSID, UUID from INTERNALOBJECT where id=?)))

Beschreibung des Problems

Wenn ein Dokument aus dem Trainingsmodus über den OK-Button gesichert wird, erscheint die im Titel stehende Fehlermeldung.

Ursache

Bei langsamen Systemen kann es zu diesem Fehler kommen, wenn docform-Anwender mehrmals hintereinander auf den OK-Button klicken. Durch ein langsames System erhält man nämlich nicht immer eine entsprechende Rückmeldung und klickt daher gerne ein zweites, drittes… Mal.

Lösung

Bitte achten Sie darauf, nur einmal auf den OK-Button zu klicken.

Hinweis: Diese Fehlermeldung erscheint im support tool im API-Bereich und nicht im docform-Abschnitt.

Support Tool DocForm in den Log Details: Definition validation failed

Beschreibung des Problems

Die Meldung / Warnung Definition validation failed logged at: agorum.docform.data.document.Document.loadXml(Document.java:64) taucht in docform auf, wenn Sie eine Suche anlegen und darunter ein Metadatum auslesen.

Ursache

Die Suche war nicht erfolgreich, und das System kann das Metadatum nicht auslesen.

Lösung

Ignorieren Sie die Meldung, wenn Ihr Training so gewollt ist.

Positionen werden nicht über metadata().load() ausgegeben

Beschreibung des Problems

Das System kann die Metadaten nicht per JavaScript über metadata().load() ausgeben.

Folgende mögliche Fehlerquellen wurden bereits überprüft:

Die Positions-Metadaten wurden über eine yml-Datei als Liste angelegt.
Der interne Name des definierten Dokumententyps entspricht dem Positions-Metadatum.
Innerhalb des Kontextmenüs Administration >Infos >Metadaten als JSON anzeigen sind die Positions-Metadaten ebenfalls vorhanden.
Betrachten Sie die Objekt-Info, sehen Sie die Rechnungspositionen folgendermaßen:

Rechnungspositionen

Ursache

Die Positions-Metadaten sind als inherited (vererbt) in der yml-Datei hinterlegt. agorum core docform setzt ausschließlich nicht vererbte Metadaten.

Lösung

Verwenden Sie für Positions ein neues Metadatum, da eine nachträgliche Änderung nicht möglich ist.

Trainingsansicht wird nicht verlassen

Ursache: Es liegen zu viele passende Trainings vor

Wenn docform mehr als ein auf das Dokument passende Training findet, kann das System den Trainingsstatus nicht verlassen. Das System weiß in diesem Falle nicht, welches Training zu verwenden ist, und kann keine Informationen auslesen.

Sie sehen unten links entsprechende Fehlermeldungen:

Mehr als eine zu diesem Dokument passendes Training gefunden

Lösung

Überarbeiten Sie die Identifikationselemente im Training, sodass diese nur bei den entsprechenden Dokumenten greifen.

Ursache: Der Dokumententyp wurde umbenannt

Manchmal bleibt ein Dokument ohne jegliche Informationen im Trainingsmodus liegen. Dann existiert der gewählte Dokumententyp nicht mehr, weil er umbenannt wurde.

Das System kann diesen nicht mehr finden, da Änderungen in Dokumententypen nicht automatisch auch auf Trainings übernommen werden.
Die Trainings verwenden somit einen veralteten Dokumententyp und überprüfen nur bei Ablage, ob der von Ihnen genutzte Dokumententyp existiert und ob alle dort eingetragenen Pflichtfelder gefüllt sind.
Wenn ja, werden die Dokumente direkt archiviert.
Wenn ein Pflichtfeld fehlt, landet das Dokument im Audit, und wenn der Dokumententyp nicht zu finden ist, passiert nichts.

Lösung

Öffnen Sie das docform-Training des betroffenen Dokuments.
Wählen Sie rechts unter Elemente das erste Element in der Struktur (1) und öffnen Sie dann die Typ-Auswahl (2).

Überprüfen, ob der Dokumententyp existiert

Ergebnis: Das System markiert einen Typ in der Typ-Auswahl blau.

• Das Training verwendet diesen Dokumententyp.
• Existiert der Dokumententyp nicht, ist in der aufklappbaren Liste kein Eintrag markiert.
Falls Sie keinen Dokumententyp markiert sehen, wählen Sie den korrekten Dokumententyp und überarbeiten Sie das Training.

Ergebnis: Das System legt das Dokument erfolgreich ab.

Hinweis: Sollten Sie auf Dokumententypen stoßen, die genauso heißen wie im Training, aber in der aufklappbaren Typ-Auswahl nicht markiert sind, kopieren Sie hier die Namen des Trainings und des realen Dokumententyps in Notepad++. So können Sie erkennen, ob Leerzeichen und Sonderleerzeichen hinzugefügt worden sind. Normale Leerzeichen stellt das Programm durch einen kleinen roten Punkt dar. Dem Sonderleerzeichen fehlen diese Punkte. Diese müssen Sie bereinigen und ein normales Leerzeichen einfügen.

Dieser Fehler tritt etwa auf, wenn Benutzer während des Trainings ihren Dokumententypen aus Word oder ähnlichen Programmen herauskopiert haben. Dadurch werden manchmal Sonderzeichen eingebaut, etwa Leerzeichen und Sonderleerzeichen.

docform liest E-Mails nicht aus

Beschreibung des Problems

Sie möchten E-Mails per docform auslesen und ablegen. In docform können Sie jedoch keinen Text in der E-Mail markieren.

Ursache

Die Einstellung im Aktiven Ordner ist nicht korrekt.

Lösung

Öffnen Sie links in der Seitenleiste Weitere Apps und dann Aktive Ordner.
Öffnen Sie den Aktiven Ordner, der auf den docform-Eingang zeigt.
Überprüfen Sie, ob bei den Parametern die Einstellung Eingabedaten auf Automatisch (PDF, dann OCR) steht.
Falls nicht, ändern Sie diese Einstellung ab und speichern Sie auf der rechten Seite.

Einstellung Eingabedaten mit Wert Automatisch (PDF, dann OCR)

Der Erkennungs-/Ausleseprozess beim Laden eines neuen Dokuments dauert zu lange

Beschreibung des Problems

docform erkennt Dokumente zu spät oder wendet Trainings zu spät an.

Prüfen Sie in diesem Falle zuerst im agorum core support tool, welche Trainings und Dokumente betroffen sind:

Öffnen Sie links in der Seitenleiste Weitere Apps und dann support tool.
Wählen Sie links im Menü DocForm.
Klicken Sie im Overview auf Show Log.
Ergebnis: Dokumente, für deren Bearbeitung docform länger als gewohnt benötigt, erscheinen mit den Meldungen xxxx miliseconds for matching document xxxx oder xxxx milliseconds elapsed while matching document against definition xxxxx, trying to abort...

Meldung im support tool
Hinweis: Die Meldung xxxx milliseconds elapsed while matching document against definition xxxxx, trying to abort... erscheint erst, wenn docform länger als 60 Sekunden benötigt, um ein Dokument oder Training zu laden. Sie können diese Laufzeit in der MetaDB unter folgendem Schlüssel anpassen:
```
MAIN_MODULE_MANAGEMENT/docform/control/MaxMatchTime
```
Geben Sie den Wert in Millisekunden an.

Ursachen

Erkennungsmerkmale (Identifizierungselemente) greifen nicht nur für die erste Seite, sondern für mehrere.
Auslese- und Suchelemente stehen auf derselben Ebene wie Identifizierungspunkte.
Sie lesen verschachtelte Positionen aus und verwenden nicht das hier beschriebene Vorgehen.
Sie setzen vergrößerte Suchfelder ein, die über mehrere Seiten reichen. docform prüft diese Suchfelder für jedes abgelegte Dokument, und die Performance kann beeinträchtigt werden. Die Identifizierungsmerkmale dürfen nur auf der ersten Seite zu finden sein.
Sie verwenden die Einstellung Verarbeiten als: OCR (siehe Festgelegte Dokumentbereiche durch die OCR auslesen lassen).

Erkennungsmerkmale (Identifizierungselemente) greifen nicht nur für die erste Seite, sondern für mehrere

Idents dienen der Identifizierung von Dokumenten. Dadurch stellen Sie sicher, dass docform das korrekte Training für die eingehenden Dokumente verwendet. Dabei stehen Idents immer auf der ersten Seite eines Dokuments. Ein Ident, der auf anderer Seite steht, ist nicht ideal und verlangsamt den Erkennungsprozess.

Auslese- und Suchelemente stehen auf derselben Ebene wie Identifizierungspunkte

Auslesekästchen und Suchelemente dürfen nicht auf derselben Ebene stehen wie Idents.

Auslese- und Suchelemente stehen auf derselben Ebene wie Idents

docform arbeitet diesen Baum von oben nach unten ab und versucht daher auch bei unpassenden Dokumenten bereits Werte auszulesen.
Diese Auslese-/Suchelemente sollten daher als Letztes ausgelesen werden und verschachtelt dem letzten Ident vorliegen.

Um Positionen auszulesen, werden mehrere Positionsanker eingesetzt:

Verschachtelte Positionen mit mehreren Positionsankern verwenden

Hinweis: Um verschachtelte Positionen in der Vergangenheit auszulesen, wurde die Taktik der verschachtelten Positionen verwendet. Verwenden Sie diese nicht, da dies ebenfalls zu einer unnötigen Verlangsamung des Erkennungsprozesses von docform führt.

Zum korrekten Trainieren von Dokumenten mit verschachtelten Positionen siehe Verschachtelte Positionen auslesen.

Lösung

Identifizieren Sie das Problemtraining mithilfe des agorum core support tools.
Wählen Sie dort im Menü DocForm > Sub Statistics > Engine.
Klicken Sie auf Configure Log und aktivieren Sie in den Debug-Modus.
Erkennen Sie Dokumente in docform neu.
Klicken Sie im agorum core support tool auf Show Log.

Ergebnis: Sie sehen, welches Training wie lange benötigt.
Identifizieren Sie die Trainings, die lange benötigen, und passen Sie sie an.
Stellen Sie den Debug-Modus zurück auf Info.

docform erkennt Trainings nicht und akzeptiert diese erst nach erneuter manueller Erkennung

Beschreibung des Problems

Wird ein Dokument in docform abgelegt, erscheint der Definitionsassistent, weil docform anscheinend kein passendes Training findet. Das Training ist jedoch vorhanden (erkennbar daran, wenn Sie das Dokument über die Kontextmenü-Aktion neu erkennen lassen).

Ursache – Ansatz 1

Im Aktiven Ordner ist der Parameter Typ gesetzt. Dadurch greifen im ersten Schritt nur Trainings, die zum eingetragenen Dokumententypen passen. Wird das Dokument neu erkannt, ignoriert docform die Einstellung des Aktiven Ordners und gleicht alle vorliegenden Trainings ab.

Lösung – Ansatz 1

Überprüfen Sie den Aktiven Ordner und ob im Parameter Typ ein Dokumententyp eingetragen ist.
Wenn Ja: Überprüfen Sie, ob diese Einstellung korrekt / gewünscht war, oder ob ein Anwenderfehler vorliegt, der den falschen Dokumententyp antrainiert hat.

Ursache – Ansatz 2

Läuft die OCR auf einem Linux-System, können „OCR Zombies“ auflaufen und die OCR-Verarbeitung blockieren. Das liegt daran, dass agorum core wenige Threads einsetzt, um die OCR anzustoßen. Sind diese Threads noch blockiert, weil sie auf ein Ende von ReadIris warten, steht der docform-Prozess.

Lösung – Ansatz 2

Killen Sie alle OCR-Leichen-Prozesse (kill-Befehl).
Installieren Sie das Plugin agorum core template manager.
Stoßen Sie die Verarbeitung in docform neu an, in dem Sie alle Dokumente in docform markieren und die Kontextmenü-Aktion agorum core template manager > Reindex objects incl. new DocumentText wählen.
Warten Sie einige Sekunden ab und erkennen Sie die neu indizierten Dokumente durch die Kontextmenü-Aktion Dokument neu erkennen.
Bauen Sie einen Prozess ein, mit dem Sie in regelmäßigen Abständen diese OCR-Leichen über einen kill-Befehl entfernen, sofern die zuvor durchgeführten Schritte das Problem lösen.

docform erkennt QR-Codes nicht richtig

Beschreibung des Problems

Sie möchten Dokumente mit QR-Codes per docform auslesen. Die Dokumente werden richtig erkannt, aber nicht die darin enthaltenen QR-Codes. Die QR-Codes auf den Originaldokumenten werden mit einem mobilen OCR-Scanner oder einem QR-Code-Scanner richtig erkannt.

Ursache

Wenn auch die Überprüfung des dazugehörigen Trainings keine Verbesserung bringt, ist vermutlich die Scan-Qualität nicht ausreichend. Das ist nicht immer sichtbar, weil die OCR-Engine die Dokumente auf Pixelebene liest. Dadurch können Texte richtig erkannt und gleichzeitig QR-Codes nicht richtig ausgelesen werden.

Lösung

Öffnen Sie den OCR-Tuner.
Prüfen Sie, ob eine Anpassung der OCR-Parameter zu einem besseren Ergebnis führt. Setzen Sie den Parameter AdaptiveBinarization (bitonal-auto) auf true.
Testen Sie verschiedene Werte für den Parameter BinarizationContrast (bitonal-contrast).
Verwenden Sie die erfolgreich getestete Einstellung.

Hinweis: Selten ist es möglich, dass QR-Codes auch mit angepassten Einstellungen nicht richtig erkannt werden. Prüfen Sie in diesem Fall mit dem Ersteller des Dokuments, ob die Druckqualität bei der Erstellung des Dokuments verbessert werden kann.

Expecting non-static method agorum.roi.ejb.common.AclUserResolver.checkEffectiveAccess

Beschreibung des Problems

Beim Bearbeiten oder Speichern von agorum core pro-Inhalten, erhalten Sie die o.g. Fehlermeldung, zum Beispiel beim Abspeichern von docform-Trainings.

Ursache

Sie haben über Ihre agorum core pro-Version ein agorum core open-Update eingespielt. Die agorum core pro-Inhalte werden hierbei nicht aktualisiert. So entsteht eine Inkonsistenz zwischen den agorum core-Modulen, die zu fehlerhaftem Verhalten führen kann.

Lösung

Laden Sie sich die Installationsdaten für agorum core pro herunter.
Installieren Sie das Update für agorum core pro.

Hinweis: Verwenden Sie für das Update auf agorum core pro mindestens die agorum core-Version, die dem verwendeten agorum core open-Update entspricht.

agorum core docform – Troubleshooting

Allgemeine Probleme / Tipps zum Feintuning

Dokument kann nicht markiert werden / enthält keine Dokumentinformationen

Beschreibung des Problems

Ursache

Lösungen

Could not save definition .. unable to create definition file

Beschreibung des Problems

Ursachen

Lösungen

Could not run global object state machine

Beschreibung des Problems

Ursache

Lösung

Could not run global object state machine (Handler threw exception: agorum.docform.worker.robot.handlers.Audit (An exception occurred while running a robot handler (No entry found for ID 'XXXX' in select select Creator, CREATeDate, CLASSID, UUID from INTERNALOBJECT where id=?)))

Beschreibung des Problems

Ursache

Lösung

Support Tool DocForm in den Log Details: Definition validation failed

Beschreibung des Problems

Ursache

Lösung

Positionen werden nicht über metadata().load() ausgegeben

Beschreibung des Problems

Ursache

Lösung

Trainingsansicht wird nicht verlassen

Ursache: Es liegen zu viele passende Trainings vor

Lösung

Ursache: Der Dokumententyp wurde umbenannt

Lösung

docform liest E-Mails nicht aus

Beschreibung des Problems

Ursache

Lösung

Der Erkennungs-/Ausleseprozess beim Laden eines neuen Dokuments dauert zu lange

Beschreibung des Problems

Ursachen

Lösung

docform erkennt Trainings nicht und akzeptiert diese erst nach erneuter manueller Erkennung

Beschreibung des Problems

Ursache – Ansatz 1

Lösung – Ansatz 1

Ursache – Ansatz 2

Lösung – Ansatz 2

docform erkennt QR-Codes nicht richtig

Beschreibung des Problems

Ursache

​​​​​Lösung

Expecting non-static method agorum.roi.ejb.common.AclUserResolver.checkEffectiveAccess

Beschreibung des Problems

Ursache

​​​​​Lösung

Lösung

Lösung