Open Source Dokumentenmanagement
Dokumentation

Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht

Navigation: Dokumentationen agorum core > agorum core docform


agorum core docform – Troubleshooting

In dieser Dokumentation finden Sie Probleme und Lösungen sowie Tipps im Umgang mit agorum core docform.

Probleme und Lösungen zu weiteren docform-Modulen finden Sie unter:

Allgemeine Probleme / Tipps zum Feintuning


Sind bereits trainierte Dokumente nicht mehr auslesbar, überprüfen Sie, ob sich das Layout verändert hat, oder überprüfen Sie:

Dokument kann nicht markiert werden / enthält keine Dokumentinformationen


Beschreibung des Problems

Das per OCR eingelesene Dokument enthält keine Dokumentinformationen und lässt sich im Training nicht mit der Maus markieren.

Ursache

Die Datei ist zu groß, damit das System sie korrekt einlesen kann. Im Standard sind maximal 20971520 Byte als Dateigröße möglich, um das System vor einem Out-Of-Memory-Fehler zu schützen.

Lösungen


Modul „agorum core docform split“ verwenden (empfohlen)

Verwenden Sie agorum core docform split (siehe Dokumente trennen), teilt das Modul Ihr PDF-Dokument in einzelne Seiten auf.


Maximale Dateigröße erhöhen

Verändern Sie im agorum core support tool den Wert des Parameters maxDocSize, indem Sie den Wert des Parameters Schritt für Schritt erhöhen und die Auswirkung prüfen.

Could not save definition .. unable to create definition file


Beschreibung des Problems

Die Fehlermeldung Could not save definition .. unable to create definition file taucht im Training auf.

Ursachen

Lösungen


Training mit gleichem Namen existiert bereits

  1. Löschen Sie das alte Training oder überarbeiten Sie dieses.


Benutzer sind für agorum core docform falsch berechtigt

  1. Überprüfen Sie die Berechtigungen der Benutzer für agorum core docform.

Could not run global object state machine


Beschreibung des Problems

Die Fehlermeldung Could not run global object state machine taucht auf.

Ursache

Metadaten wurden neu angelegt und im Dokumententyp angepasst, aber nicht in den vorhandenen Trainings.

Lösung

  1. Passen Sie jedes betroffene Training an.
  2. Lesen Sie das neue Metadatum aus.
  3. Prüfen Sie, ob der FileWorkflow oder ein daran anschließender Workflow ebenfalls eine Korrektur benötigt.

Could not run global object state machine (Handler threw exception: agorum.docform.worker.robot.handlers.Audit (An exception occurred while running a robot handler (No entry found for ID 'XXXX' in select select Creator, CREATeDate, CLASSID, UUID from INTERNALOBJECT where id=?)))


Beschreibung des Problems

Wenn ein Dokument aus dem Trainingsmodus über den OK-Button gesichert wird, erscheint die im Titel stehende Fehlermeldung.

Ursache

Bei langsamen Systemen kann es zu diesem Fehler kommen, wenn docform-Anwender mehrmals hintereinander auf den OK-Button klicken. Durch ein langsames System erhält man nämlich nicht immer eine entsprechende Rückmeldung und klickt daher gerne ein zweites, drittes… Mal.

Lösung

Bitte achten Sie darauf, nur einmal auf den OK-Button zu klicken.

Hinweis: Diese Fehlermeldung erscheint im support tool im API-Bereich und nicht im docform-Abschnitt.

Support Tool DocForm in den Log Details: Definition validation failed


Beschreibung des Problems

Die Meldung / Warnung Definition validation failed logged at: agorum.docform.data.document.Document.loadXml(Document.java:64) taucht in docform auf, wenn Sie eine Suche anlegen und darunter ein Metadatum auslesen.

Ursache

Die Suche war nicht erfolgreich, und das System kann das Metadatum nicht auslesen.

Lösung

Ignorieren Sie die Meldung, wenn Ihr Training so gewollt ist.

Positionen werden nicht über metadata().load() ausgegeben


Beschreibung des Problems

Das System kann die Metadaten nicht per JavaScript über metadata().load() ausgeben.

Folgende mögliche Fehlerquellen wurden bereits überprüft:

Rechnungspositionen

Ursache

Die Positions-Metadaten sind als inherited (vererbt) in der yml-Datei hinterlegt. agorum core docform setzt ausschließlich nicht vererbte Metadaten.

Lösung

  1. Verwenden Sie für Positions ein neues Metadatum, da eine nachträgliche Änderung nicht möglich ist.

Trainingsansicht wird nicht verlassen


Ursache: Es liegen zu viele passende Trainings vor

Wenn docform mehr als ein auf das Dokument passende Training findet, kann das System den Trainingsstatus nicht verlassen. Das System weiß in diesem Falle nicht, welches Training zu verwenden ist, und kann keine Informationen auslesen.

Sie sehen unten links entsprechende Fehlermeldungen:

Mehr als eine zu diesem Dokument passendes Training gefunden

Lösung

  1. Überarbeiten Sie die Identifikationselemente im Training, sodass diese nur bei den entsprechenden Dokumenten greifen.

Ursache: Der Dokumententyp wurde umbenannt

Manchmal bleibt ein Dokument ohne jegliche Informationen im Trainingsmodus liegen. Dann existiert der gewählte Dokumententyp nicht mehr, weil er umbenannt wurde.

Lösung

  1. Öffnen Sie das docform-Training des betroffenen Dokuments.
  2. Wählen Sie rechts unter Elemente das erste Element in der Struktur (1) und öffnen Sie dann die Typ-Auswahl (2).

     
    Überprüfen, ob der Dokumententyp existiert


    Ergebnis: Das System markiert einen Typ in der Typ-Auswahl blau.

    • Das Training verwendet diesen Dokumententyp.
    • Existiert der Dokumententyp nicht, ist in der aufklappbaren Liste kein Eintrag markiert.
  3. Falls Sie keinen Dokumententyp markiert sehen, wählen Sie den korrekten Dokumententyp und überarbeiten Sie das Training.

    Ergebnis: Das System legt das Dokument erfolgreich ab.

Hinweis: Sollten Sie auf Dokumententypen stoßen, die genauso heißen wie im Training, aber in der aufklappbaren Typ-Auswahl nicht markiert sind, kopieren Sie hier die Namen des Trainings und des realen Dokumententyps in Notepad++. So können Sie erkennen, ob Leerzeichen und Sonderleerzeichen hinzugefügt worden sind. Normale Leerzeichen stellt das Programm durch einen kleinen roten Punkt dar. Dem Sonderleerzeichen fehlen diese Punkte. Diese müssen Sie bereinigen und ein normales Leerzeichen einfügen.

 

 

 

Dieser Fehler tritt etwa auf, wenn Benutzer während des Trainings ihren Dokumententypen aus Word oder ähnlichen Programmen herauskopiert haben. Dadurch werden manchmal Sonderzeichen eingebaut, etwa Leerzeichen und Sonderleerzeichen.

docform liest E-Mails nicht aus


Beschreibung des Problems

Sie möchten E-Mails per docform auslesen und ablegen. In docform können Sie jedoch keinen Text in der E-Mail markieren.

Ursache

Die Einstellung im Aktiven Ordner ist nicht korrekt.

Lösung

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann Aktive Ordner.
  2. Öffnen Sie den Aktiven Ordner, der auf den docform-Eingang zeigt.
  3. Überprüfen Sie, ob bei den Parametern die Einstellung Eingabedaten auf Automatisch (PDF, dann OCR) steht.
  4. Falls nicht, ändern Sie diese Einstellung ab und speichern Sie auf der rechten Seite.
Einstellung Eingabedaten mit Wert Automatisch (PDF, dann OCR)

Der Erkennungs-/Ausleseprozess beim Laden eines neuen Dokuments dauert zu lange


Beschreibung des Problems

docform erkennt Dokumente zu spät oder wendet Trainings zu spät an.

Prüfen Sie in diesem Falle zuerst im agorum core support tool, welche Trainings und Dokumente betroffen sind:

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann support tool.
  2. Wählen Sie links im Menü DocForm.
  3. Klicken Sie im Overview auf Show Log.
  4. Ergebnis: Dokumente, für deren Bearbeitung docform länger als gewohnt benötigt, erscheinen mit den Meldungen xxxx miliseconds for matching document xxxx oder xxxx milliseconds elapsed while matching document against definition xxxxx, trying to abort...

     
    Meldung im support tool
     

    Hinweis: Die Meldung xxxx milliseconds elapsed while matching document against definition xxxxx, trying to abort... erscheint erst, wenn docform länger als 60 Sekunden benötigt, um ein Dokument oder Training zu laden. Sie können diese Laufzeit in der MetaDB unter folgendem Schlüssel anpassen:

    MAIN_MODULE_MANAGEMENT/docform/control/MaxMatchTime

    Geben Sie den Wert in Millisekunden an.

Ursachen


Erkennungsmerkmale (Identifizierungselemente) greifen nicht nur für die erste Seite, sondern für mehrere

Idents dienen der Identifizierung von Dokumenten. Dadurch stellen Sie sicher, dass docform das korrekte Training für die eingehenden Dokumente verwendet. Dabei stehen Idents immer auf der ersten Seite eines Dokuments. Ein Ident, der auf anderer Seite steht, ist nicht ideal und verlangsamt den Erkennungsprozess.
 

Auslese- und Suchelemente stehen auf derselben Ebene wie Identifizierungspunkte

Auslesekästchen und Suchelemente dürfen nicht auf derselben Ebene stehen wie Idents.

Auslese- und Suchelemente stehen auf derselben Ebene wie Idents

docform arbeitet diesen Baum von oben nach unten ab und versucht daher auch bei unpassenden Dokumenten bereits Werte auszulesen.
Diese Auslese-/Suchelemente sollten daher als Letztes ausgelesen werden und verschachtelt dem letzten Ident vorliegen.

Um Positionen auszulesen, werden mehrere Positionsanker eingesetzt:

Verschachtelte Positionen mit mehreren Positionsankern verwenden

Hinweis: Um verschachtelte Positionen in der Vergangenheit auszulesen, wurde die Taktik der verschachtelten Positionen verwendet. Verwenden Sie diese nicht, da dies ebenfalls zu einer unnötigen Verlangsamung des Erkennungsprozesses von docform führt.

Zum korrekten Trainieren von Dokumenten mit verschachtelten Positionen siehe Verschachtelte Positionen auslesen.

Lösung

  1. Identifizieren Sie das Problemtraining mithilfe des agorum core support tools.
  2. Wählen Sie dort im Menü DocForm > Sub Statistics > Engine.
  3. Klicken Sie auf Configure Log und aktivieren Sie in den Debug-Modus.
  4. Erkennen Sie Dokumente in docform neu.
  5. Klicken Sie im agorum core support tool auf Show Log.

    Ergebnis: Sie sehen, welches Training wie lange benötigt.
  6. Identifizieren Sie die Trainings, die lange benötigen, und passen Sie sie an.
  7. Stellen Sie den Debug-Modus zurück auf Info.

docform erkennt Trainings nicht und akzeptiert diese erst nach erneuter manueller Erkennung


Beschreibung des Problems

Wird ein Dokument in docform abgelegt, erscheint der Definitionsassistent, weil docform anscheinend kein passendes Training findet. Das Training ist jedoch vorhanden (erkennbar daran, wenn Sie das Dokument über die Kontextmenü-Aktion neu erkennen lassen).

Ursache – Ansatz 1

Im Aktiven Ordner ist der Parameter Typ gesetzt. Dadurch greifen im ersten Schritt nur Trainings, die zum eingetragenen Dokumententypen passen. Wird das Dokument neu erkannt, ignoriert docform die Einstellung des Aktiven Ordners und gleicht alle vorliegenden Trainings ab.

Lösung – Ansatz 1

  1. Überprüfen Sie den Aktiven Ordner und ob im Parameter Typ ein Dokumententyp eingetragen ist.
  2. Wenn Ja: Überprüfen Sie, ob diese Einstellung korrekt / gewünscht war, oder ob ein Anwenderfehler vorliegt, der den falschen Dokumententyp antrainiert hat.

Ursache – Ansatz 2

Läuft die OCR auf einem Linux-System, können „OCR Zombies“ auflaufen und die OCR-Verarbeitung blockieren. Das liegt daran, dass agorum core wenige Threads einsetzt, um die OCR anzustoßen. Sind diese Threads noch blockiert, weil sie auf ein Ende von ReadIris warten, steht der docform-Prozess.

Lösung – Ansatz 2

  1. Killen Sie alle OCR-Leichen-Prozesse (kill-Befehl).
  2. Installieren Sie das Plugin agorum core template manager.
  3. Stoßen Sie die Verarbeitung in docform neu an, in dem Sie alle Dokumente in docform markieren und die Kontextmenü-Aktion agorum core template manager > Reindex objects incl. new DocumentText wählen.
  4. Warten Sie einige Sekunden ab und erkennen Sie die neu indizierten Dokumente durch die Kontextmenü-Aktion Dokument neu erkennen.
  5. Bauen Sie einen Prozess ein, mit dem Sie in regelmäßigen Abständen diese OCR-Leichen über einen kill-Befehl entfernen, sofern die zuvor durchgeführten Schritte das Problem lösen.

docform erkennt QR-Codes nicht richtig


Beschreibung des Problems

Sie möchten Dokumente mit QR-Codes per docform auslesen. Die Dokumente werden richtig erkannt, aber nicht die darin enthaltenen QR-Codes. Die QR-Codes auf den Originaldokumenten werden mit einem mobilen OCR-Scanner oder einem QR-Code-Scanner richtig erkannt.

Ursache

Wenn auch die Überprüfung des dazugehörigen Trainings keine Verbesserung bringt, ist vermutlich die Scan-Qualität nicht ausreichend. Das ist nicht immer sichtbar, weil die OCR-Engine die Dokumente auf Pixelebene liest. Dadurch können Texte richtig erkannt und gleichzeitig QR-Codes nicht richtig ausgelesen werden.

​​​​​Lösung

  1. Öffnen Sie den OCR-Tuner.
  2. Prüfen Sie, ob eine Anpassung der OCR-Parameter zu einem besseren Ergebnis führt. Setzen Sie den Parameter AdaptiveBinarization (bitonal-auto) auf true. 
  3. Testen Sie verschiedene Werte für den Parameter BinarizationContrast (bitonal-contrast).
  4. Verwenden Sie die erfolgreich getestete Einstellung. 

    Hinweis: Selten ist es möglich, dass QR-Codes auch mit angepassten Einstellungen nicht richtig erkannt werden. Prüfen Sie in diesem Fall mit dem Ersteller des Dokuments, ob die Druckqualität bei der Erstellung des Dokuments verbessert werden kann.

 

Expecting non-static method agorum.roi.ejb.common.AclUserResolver.checkEffectiveAccess


Beschreibung des Problems

Beim Bearbeiten oder Speichern von agorum core pro-Inhalten, erhalten Sie die o.g. Fehlermeldung, zum Beispiel beim Abspeichern von docform-Trainings.

Ursache

Sie haben über Ihre agorum core pro-Version ein agorum core open-Update eingespielt. Die agorum core pro-Inhalte werden hierbei nicht aktualisiert. So entsteht eine Inkonsistenz zwischen den agorum core-Modulen, die zu fehlerhaftem Verhalten führen kann.

​​​​​Lösung

  1. Laden Sie sich die Installationsdaten für agorum core pro herunter.
  2. Installieren Sie das Update für agorum core pro.

    Hinweis: Verwenden Sie für das Update auf agorum core pro mindestens die agorum core-Version, die dem verwendeten agorum core open-Update entspricht.