Open Source Dokumentenmanagement
Dokumentation

Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht

Navigation: Dokumentationen agorum core > agorum core docform


Dokumente trainieren für Anfänger

Diese Dokumentation zeigt, wie Sie Dokumente mit docform trainieren. Folgende Bereiche lernen Sie kennen:

Voraussetzungen


Dokumente ohne Positionen trainieren


Beim Dokumente trainieren ohne Positionen handelt es sich um Rechnungen und / oder Lieferscheine, die keine Positionsdaten aufweisen, d. h. in denen etwa keine Artikel in einer Tabelle vorhanden sind.

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann docform.
  2. Wählen Sie den entsprechenden Aktiven Ordner aus, den Ihr Administrator für Sie eingerichtet hat.

    Ergebnis: Links in der erscheinenden Tabelle befinden sich alle Dokumente, die Sie trainieren können. In der Spalte Schritt steht beim jeweiligen Dokument Training.

     
    Schritt Training
  3. Klicken Sie mit der linken Maustaste auf eines dieser Dokumente.

    Ergebnis: Die Vorschau des Dokuments öffnet sich und der Definitionsassistent erscheint, der Sie Schritt für Schritt durch das Training führt.
  4. Wählen Sie den passenden Typ. 

    Die richtige Wahl ist wichtig, da zu jedem Typ die entsprechenden Metadaten hinterlegt sind und diese während des Trainings abgefragt werden.
  5. Geben Sie eine Herkunft ein.

    a) Klicken Sie in das Feld.
    b) Fahren Sie mit der rechten Maustaste im Dokument über den Aussteller / Absender des Dokuments, etwa Amazon.

    Ergebnis: Der Bereich färbt sich gelb.
  6. Lassen Sie die rechte Maustaste los.

    Ergebnis: Das System übernimmt die markierte Herkunft automatisch in das Feld.

    Das Feld Name setzt sich automatisch aus diesen beiden Feldern zusammen. Sie können den Namen nachträglich ändern oder ihn stehenlassen.

     
    Name der Definition im Definitionsassistenten

    Hinweis: Bei der Herkunft dürfen keine Sonderzeichen enthalten sein, es muss sich um reinen Text oder Zahlen handeln. Andernfalls kann das System das Training nicht korrekt anwenden.

  7. Klicken Sie auf Weiter.
  8. Markieren Sie im Dokument mit der rechten Maustaste zwei eindeutige Identifizierungsmerkmale.

    Anhand der Identifizierungsmerkmale erkennt das System zukünftig das Training. Hierbei kann es sich etwa um die Wörter Rechnung und den Aussteller der Rechnung handeln.

    Ergebnis: Die beiden markierten Identifizierungsmerkmale tauchen rechts in einer Art Baumstruktur auf. Gleichzeitig fragt der Definitionsassistent die Metadaten ab, die Ihr Administrator definiert hat.
     
    Identifizierungsmerkmale
  9. Klicken Sie auf Identifikation abgeschlossen.
  10. Klicken Sie mit der rechten Maustaste im Dokument das erste Metadatum an, das das System nun abfragt, etwa die Rechnungsnummer.

    Es muss sich um die Rechnungsnummer an sich handeln, etwa RE-12345, die Sie im Dokument markieren.
  11. Markieren Sie die Referenz zur Rechnungsnummer.

    Die Referenz zur Rechnungsnummer ist eine Position zur Rechnungsnummer, die immer gleichbleibend ist, etwa das Wort Rechnungsnr. (siehe Abbildung Referenz zur Rechnungsnummer).
     
    Referenz zur Rechnungsnummer


    Ergebnis: Die Rechnungsnummer und die Referenz erscheinen rechts unterhalb der Baumstruktur. Wiederholen Sie die Schritte bei allen nachfolgenden Metadaten, die das System abfragt.

    Hinweis: Die Kästchen auf dem Dokument können Sie nachträglich von der Größe her anpassen, sollte der Wert dazu nicht korrekt erfasst worden sein.
     

    Wert nachträglich anpassen
  12. Prüfen Sie nach Abschluss nochmals alle markierten und ausgelesenen Werte / Metadaten in der Baumstruktur und gleichen Sie diese mit dem Dokument ab.
  13. Klicken Sie auf OK.

    Tipp: Die Schaltfläche Übernehmen bewirkt, dass Ihre Änderungen nur zwischengespeichert werden. Dies ist etwa sinnvoll, wenn Sie beim Trainieren unterbrochen werden. Damit Sie das Training abschließen können, ist ein Klick auf OK zwingend notwendig.

    Ergebnis: Sie haben das Dokument ohne Positionen trainiert.

Dokumente mit Positionen trainieren


Beim Dokumente trainieren mit Positionen handelt es sich um Rechnungen und / oder Lieferscheine, die eine Tabelle mit Positionsdaten aufweisen, d. h. in diesen Tabellen befinden etwa Artikel.

  1. Wiederholen Sie die Schritte 1 bis 10 unter Dokumente ohne Positionen trainieren, bis Sie zum Positionsanker kommen.

     
    Positionsanker
     

    Der Positionsanker definiert, ab wann das System erkennen soll, dass im Dokument Positionen beginnen.
  2. Markieren Sie in der Tabelle mit den Positionen das erste Wort oder den Wert in der ersten Zeile unterhalb der Überschrift (in der Abbildung Referenz zum Positionsanker ist dies der Wert 30).

    Tipp: Möchten Sie eine Rechnung trainieren, die oberhalb der Positionen nur gelegentlich Informationen wie eine Bestellnummer enthält und in den anderen Fällen an dieser Stelle frei ist, so setzen Sie den Positionsanker auf den ersten Wert in der Tabelle. Verschieben Sie ihn mit der linken Maustaste auf diese freie Stelle.
     

    Positionsanker verschieben
  3. Markieren Sie die Referenz zum Positionsanker. Dies sollte das erste Wort in der Tabelle sein, in der Abbildung Referenz zum Positionsanker ist dies das Wort Menge.

     
    Referenz zum Positionsanker

    Tipp: Sollte das System ein Metadatum namens Nummer abfragen und auf dem Dokument keine Spalte Nummer existieren, überspringen Sie diese Abfrage, indem Sie auf Weiter klicken. 

  4. Markieren Sie alle weiteren Metadaten.

    Bei Metadaten wie Bezeichnung, Menge oder Preis markieren Sie lediglich den Wert des Metadatums, jedoch keine Referenz. Diese benötigen Sie in den Positionen nicht. Ausnahme bildet der Positionsanker. Überspringen Sie deshalb jeweils die Referenz.

    Tipp: Sollte etwa eine Bezeichnung eines Artikels über zwei Zeilen gehen, vergrößern Sie das Suchkästchen etwa beim Metadatum Bezeichnung. Andernfalls landet das Dokument im Audit, weil das System den Wert nicht auslesen kann.

  5. Klicken Sie auf OK.

    Ergebnis: Sie haben ein Dokument mit Positionen trainiert.

Umgang mit einmaligen Dokumenten


Kommen bei Ihnen Einzelrechnungen oder generell Dokumente vor, die einmalig sind, etwa eine Bestellung bei einem Lieferanten, müssen Sie die Dokumente nicht trainieren.

Gehen Sie in diesem Fall wie folgt vor:

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann DocForm.
  2. Wählen Sie das Dokument links aus der Liste.

    Ergebnis: Der Definitionsassistent öffnet sich.
  3. Wählen Sie einen Typ und (optional) eine Herkunft.
  4. Klicken Sie auf Nicht trainieren.

    Ergebnis: Das Dokument landet im Audit.
  5. Markieren Sie im Audit mit der rechten Maustaste manuell die entsprechenden Werte zu den Metadaten des Dokuments und / oder fügen Sie Positionen manuell hinzu, falls es sich um ein Dokument mit Positionen handelt.
  6. Klicken Sie auf OK.
Umgang mit einmaligen Dokumenten im Definitionsassistenten

Falsch ausgelesenes Dokument erneut trainieren


Liest docform ein bereits archiviertes (abgelegtes) Dokument falsch aus, passen Sie das Training dieses Dokuments nachträglich an.

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann DocForm.
  2. Wählen Sie den entsprechenden Ordner für eingehende Dokumente.
  3. Klicken Sie oben auf Allgemein > Einzelnes Dokument trainieren ...
  4. Öffnen Sie den Ordner, in den docform das falsch ausgelesene Dokument abgelegt hat.
  5. Öffnen Sie das Dokument mit einem Doppelklick.

    Ergebnis: Das bereits trainierte Dokument öffnet sich.
  6. Passen Sie das Training an, sodass docform zukünftig die korrekten Werte aus dem Dokument ausliest.
  7. Klicken Sie auf OK.

    Ergebnis: Sie haben das Training angepasst. Es greift für alle zukünftigen Dokumente dieses Typs. docform passt das aktuell ausgewählte Dokument NICHT an.
Einzelnes Dokument trainieren

Ein Training duplizieren


Wenn Sie ein Dokument trainieren möchten, das einem bereits trainierten Dokument zwar ähnelt, aber davon zu sehr abweicht, um ein gemeinsames Training bereitzustellen, können Sie die vorhandene Definition duplizieren und auf dieser Basis die für das neue Dokument nötigen Anpassungen vornehmen.

  1. Öffnen Sie links in der Seitenleiste Weitere Apps und dann docform.
  2. Wählen Sie den entsprechenden Aktiven Ordner aus, den Ihr Administrator für Sie eingerichtet hat.
  3. Klicken Sie links in der erscheinenden Tabelle ein Dokument an.

    Ergebnis: Der Definitionsassistent öffnet sich.
  4. Wählen Sie im Kontextmenü Duplizieren.

     
    Training duplizieren


    Ergebnis:

    • Das vorhandene Training wird dupliziert.
    • Alle Felder bis auf das Feld Herkunft stimmen mit dem duplizierten Training überein.

Weitere Einstellungen beim Trainieren


Eine Konstante erstellen

Eine Konstante  setzen Sie, wenn Sie ein Metadatum benötigen, das docform nicht auslesen soll, d. h. Sie vergeben diese Konstante fest für dieses Dokument.

Eine Konstante ist etwa bei einem Lieferanten sinnvoll, da der Lieferant im Dokument immer gleich lautet und sich nicht verändert. Da Sie dafür den Assistenten beenden müssen, setzen Sie eine Konstante am Schluss.

So setzen Sie eine Konstante im Falle eines Lieferanten:

  1. Starten Sie das Training wie gewohnt.
  2. Überspringen Sie die Abfrage des Metadatums Lieferant (oder ähnlich lautend), indem Sie im Definitionsassistent auf Weiter klicken.

     
    Schaltfläche Weiter im Definitionsassistenten
  3. Führen Sie das Training wie gewohnt fort.

    Ergebnis: Nachdem docform alle Metadaten abgefragt hat, schließt sich der Definitionsassistent.
  4. Klicken Sie rechts in der Baumstruktur mit der rechten Maustaste auf das erste Identifizierungsmerkmal (meist Rechnung, siehe Abbildung Identifizierungsmerkmale).
  5. Wählen Sie im Kontextmenü Neue Konstante erstellen.
  6. Wählen Sie im Feld Name das Metadatum, das den Lieferanten abfragt.
  7. Tragen Sie im Feld Wert den Namen des Lieferanten ein und ignorieren Sie alle anderen Felder und Schaltflächen.

     
    Wert und Name einer Konstanten


    Ergebnis: Sie haben eine Konstante erstellt.

Auf allen Seiten suchen

Bei Dokumenten mit Positionen kann ein Dokument schnell mehrere Seiten groß werden. In diesem Falle rutschen die Beträge (Netto-, MwSt.- sowie Bruttobeträge) automatisch ans Ende eines Dokuments. Diese befinden sich also theoretisch immer an einer anderen Stelle.

Damit docform auf allen vorhandenen Seiten nach deren Referenz sucht, existiert eine Einstellung, die Sie nach dem eigentlichen Training anwenden können.

Hinweis: Die nachfolgenden Schritte entfallen, sofern Sie ein Dokument trainieren, das bereits auf Seite 2 oder 3 die Beträge enthält. docform erkennt automatisch, dass es sich nicht um die erste Seite handelt, und sucht zukünftig bei diesem Dokument automatisch auf allen vorhandenen Seiten.

So gehen Sie vor, um die Einstellung Auf allen Seiten suchen zu setzen:

  1. Klicken Sie rechts in der Baumstruktur mit der rechten Maustaste etwa auf den Nettobetrag (Referenz ).
  2. Aktivieren Sie im Kontextmenü die Option Auf allen Seiten suchen, indem Sie den Haken setzen.
  3. Wiederholen Sie die Schritte bei etwa dem MwSt.-Betrag und dem Bruttobetrag.
Einstellung Auf allen Seiten suchen aktivieren

Suchelemente und deren Einstellungen


Die Suchelemente öffnen sich, wenn Sie eine Referenz  rechts in der Baumstruktur wählen. Unterhalb öffnet sich ein Dialog namens Eigenschaften. Hier können Sie einige Einstellungen treffen, die Auswirkungen auf das Training oder die Referenz haben.

Suchelemente und deren Einstellungen

Um die Übersicht zu gewährleisten, lernen Sie nur einen Bruchteil der vorhandenen Einstellungen kennen. Ignorieren Sie alle sonstigen Einstellungen, die weiter unten zu sehen sind, vorerst.

Einstellung „Wert“

Definiert die Referenz, nach der docform sucht. Diese gibt der definierte Dokumententyp vor.

Hinweis: Die Werte Ihrer Suchelemente dürfen keine Rechtschreibfehler enthalten.

Einstellung „Genauigkeit“

Definiert die Genauigkeit, mit der docform den Text erkennen soll. Durch einen niedrigen Wert erzielen Sie eine ungenauere Suche. Das bedeutet, dass es Abweichungen bei der Schreibweise der gefundenen Worte geben kann. Diese Einstellung verwenden Sie, wenn docform die Dokumente schlecht erkennt und dadurch Fehler passieren, etwa schlecht leserliche Schrift.

Im Standard liegt die Genauigkeit zwischen 75 und 80 Prozent. Eine Genauigkeit von 100 bedeutet, dass das Wort oder die Referenz genau so im Dokument vorkommen muss, wie es im Feld Wert heißt.


Beispiel

Wenn das Suchwort aus 10 Buchstaben besteht und die Genauigkeit auf 80 % steht, findet docform das Wort auch bei 8 erkannten Buchstaben.

Einstellung „rückwärts suchen“

Definiert, dass docform den Text innerhalb des Suchkastens von links unten anstatt von links oben durchsucht.

Einstellung rückwärts suchen

Einstellung „ersten Treffer verwenden“

Definiert, dass docform den ersten gefundenen Treffer zur Referenz auslesen soll. Dies kann etwa bei einer ungenaueren Suche wichtig sein. So verwendet docform immer den ersten Treffer, unabhängig davon, ob es weitere oder bessere Treffer gibt.

Audit


Im Audit landet ein Dokument, nachdem Sie es trainiert haben, docform es aber nicht korrekt erkannt hat. D. h. docform konnte ein Wert oder mehrere Werte nicht korrekt auslesen. In diesem Fall erhält ein Dokument den Status Audit. Ob ein Dokument im Audit liegt oder nicht, sehen Sie, sobald Sie das Modul docform von der Startseite aus öffnen:

Dokumente im Status Audit

Prüfen Sie das Dokument auf Fehler, sobald sich ein Dokument in diesem Status befindet. docform zeigt an, welche Werte es nicht auslesen konnte. Dazu markieren Sie das Dokument in der linken Tabelle.

Um den Wert zu korrigieren, vergrößern Sie den Auslesekasten:

Fehler im Dokument korrigieren

In diesem Falle wurde übersehen, dass Bezeichnungen der Artikel auch über mehrere Zeilen gehen können. Vergrößern Sie hier den Auslesekasten, damit docform auch die zweite Zeile erfasst. docform zeigt im Anschluss automatisch an, ob es die Bezeichnung des Artikels wie hier nun auslesen kann.

Klicken Sie danach auf OK, damit docform das Dokument ablegt.

Aktionen im Audit durchführen

Prüfen Sie die ausgelesenen Positionen immer auf Vollständigkeit und gleichen Sie sie mit dem Dokument ab. Stellen Sie fest, dass Positionen fehlen oder zu viele Positionen vorhanden sind, können Sie Zeilen:

Die Aktionen rufen Sie in der Tabelle unten im Abschnitt positionen auf, indem Sie die rechte Maustaste verwenden.

Aktion Beschreibung
Neue Zeilen vor dieser Zeile einfügen Fügt eine neue Zeile vor der markierten Zeile ein.
Neue Zeile nach dieser Zeile einfügen Fügt eine neue Zeile nach der markierten Zeile ein.
Zeile duplizieren Dupliziert die markierte Zeile.
Diese Zeile löschen Löscht die markierte Zeile.

Aktuelles Dokument neu trainieren

Landet ein Dokument im Audit und ist Ihnen im Training ein Fehler unterlaufen, können Sie das Dokument aus dem Audit heraus in ein Training überführen, ohne dass sich die Vorschau des Dokuments (mittlere Ansicht) schließt.

  1. Klicken Sie mit der linken Maustaste auf ein Dokument links in der Tabelle im Status Audit.
  2. Wählen Sie oben im Menü Audit > Aktuelles Dokument neu trainieren.

    Ergebnis: Das Dokument verschwindet aus dem Audit und das Training öffnet sich. Das Dokument verbleibt in der mittleren Ansicht, sodass Sie es nicht erneut suchen müssen.
Aktuelles Dokument neu trainieren