Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core docform > Definitionen (.dfdl-Dateien)
Der agorum core docform definitionsassistent hilft Ihnen Ihre Dokumente bestmöglich zu trainieren. Befolgen Sie einfach die Anweisungen und markieren Sie die angeforderten Metadaten direkt im Dokument mit Rechtsklick und Ziehen der Maus. Dieser öffnet sich automatisch, sobald ein unbekanntes Objekt in agorum core docform gelangt.
Möchten Sie diesen manuell starten, gehen Sie in agorum core docform und wählen Sie unter Allgemein > Einzelnes Dokument trainieren aus. Es öffnet sich darauf eine Eingabemaske in der Sie ein bereits abgelegtes Dokument als Training benutzen können. Dies kann auch ein bereits abgelegtes Dokument sein, dass verbessert werden soll. Doch Achtung - diese Dokumente werden nur für die Erstellung eines Trainings benutzt, Metadaten werden nicht neu gesetzt.
Je nach agorum core Version befindet sich Allgemein links oder rechts Ihrer Suchleiste.
Um im Trainings- oder Audit-Modus Text auszulesen wird dieser mit gedrückter rechter Maustaste markiert. Handelt es nur um ein Wort reicht in der Regel ein Rechtsklick darauf aus.
Drücken Sie Shift und Scrollen Sie gleichzeitig, um stufenlos zu zoomen. Mit den Zoom-Buttons (Lupen) oberhalb des jeweiligen Dokuments ist Zoomen ebenfalls möglich.
Mit Shift + gedrückte linke Maustaste können Sie das Dokument nach Belieben verschieben.
Die Bearbeitung mit Hilfe des Assistenten ist empfohlen. Für eine manuelle Bearbeitung kann der Assistent jederzeit unterbrochen werden.
Sobald der Assistent abgeschlossen ist, gibt es natürlich die Möglichkeit die Definition zu bearbeiten.
Für ein neues Dokument müssen Sie zunächst einen Namen vergeben. Dieser setzt sich sonst automatisch aus den Feldern Typ und Herkunft zusammen, kann nachträglich aber immer noch angepasst werden.
Per Drop-Down-Menü wird hier bei Typ der richtige Dokumenttyp ausgewählt. Die richtige Auswahl ist wichtig, da zu jedem Typ die entsprechenden Metadaten hinterlegt sind und diese während des Trainings abgefragt werden. Zudem steckt in den Definitionen der Workflows an verschiedenen Stellen eine Bedingung bezogen auf den agorum core docform Dokumenttyp.
Mit Herkunft ist beispielsweise der Aussteller einer Rechnung gemeint. Es empfiehlt sich, den angegebenen Namen aus dem Dokument zu übernehmen.
Aus diesen Informationen wird das Definitionselement angelegt, welches die Wurzel der Baumstruktur bildet.
Sofern eine bereits vorhandene Definition überarbeitet werden soll, muss diese markiert und auf den Button Anpassen geklickt werden. Die Definition wird geladen, auf das ausgewählte Dokument angewandt und kann dann entsprechend bearbeitet und im Anschluss gespeichert werden.
Sie können ein eventuell einmalig vorkommendes Dokument nicht trainieren, indem Sie den Dokumententyp sowie die Herkunft angeben und den agorum core docform definitionsassistenten mit dem Button Nicht trainieren beenden.
Für das Dokument wird keine Definition angelegt, sondern es automatisch ins Audit verschoben. Dort können Sie die zum Dokumententyp gehörenden Metadaten manuell auslesen. Dadurch ist das Dokument zwar untrainiert, jedoch vollständig verschlagwortet.
Wenn Sie ein Dokument trainieren möchten, das einem bereits trainierten Dokument zwar ähnelt, aber davon zu sehr abweicht, um ein gemeinsames Training bereitzustellen, können Sie die vorhandene Definition duplizieren und auf dieser Basis die für das neue Dokument nötigen Anpassungen vornehmen.
Wählen Sie hierfür aus dem Kontextmenü der vorhandenen Definition den Befehl Duplizieren. Dadurch wird eine neue Definition erstellt, die bis auf das Feld "Herkunft" mit der vorhandenen Definition übereinstimmt.
Sobald alle Angaben stimmen, beginnen Sie das Training mit Weiter.
Um ein Dokument eindeutig zu erkennen und die passende Definition für das Auslesen der Metadaten zu nutzen, müssen Identifikationsmerkmale definiert werden. Sie werden vom Assistenten aufgefordert, zwei Identifikationsmerkmale festzulegen. Sie definieren diese, indem Sie die entsprechende Stelle, wie beim Auslesen von Daten, mit der rechten Maustaste markieren. Sie können außerdem jederzeit weitere Identifikationsmerkmale definieren.
Nach Auswahl der Identifikationsfelder klicken Sie auf Identifikation abgeschlossen.
Um die Identifizierung schließen zu können, müssen mindestens 2 Elemente ausgewählt werden. Dies ist bei einem Barcodes nicht möglich, da er das einzige Element zur Identifizierung ist. Das Problem lässt sich aber leicht umgehen: Sie markieren den Barcode einfach zweimal, schließen die Identifizierung ab und löschen das doppelte Element.
Für ein Identifizierungsfeld können Sie ebenfalls eine Regular Expression verwenden. Dazu muss der reguläre Ausruck zwischen zwei Slashes (//) in den Wert eingetragen werden. Dies können Sie nach Abschluss des Assistenten ändern.
Dieses Vorgehen kann zum Beispiel hilfreich sein, wenn Sie einen Barcode als Identifizierung verwenden, der stets die gleiche Zahlenstruktur hat.
Beispiel:
Der Barcode zur Identifizierung, hat immer die Struktur A-4Ziffern-3Ziffern, also zum Beispiel A-1234-12. Damit könnte der reguläre Ausdruck so aussehen:
[A][-][0-9]{4}[-][0-9]{2}
Im Feld Wert muss der Ausdruck zwischen zwei Slashes geschrieben werden:
/[A][-][0-9]{4}[-][0-9]{2}/
Der Assistent führt Sie durch das Auslesen der im Dokumenttyp hinterlegten Metadaten. Sie markieren die Daten mit gedrückter rechter Maustaste. Es wird zuerst nach dem Metadatum gefragt und dann nach einer Referenz. Beim Beispiel der Rechnungsnummer ist die Zahlenfolge das Metadatum und die Bezeichnung Rechnungsnummer die Referenz.
Mit Zurück kann ein z.B. falsch eingelesenes Feld gelöscht und neu eingelesen werden.
Sobald der betreffende Text markiert wurde, wird automatisch eine grüne Region erzeugt. In dieser sucht agorum core docform nach dem markierten Text. Sie können die Region durch ziehen der weißen Kästchen anpassen. Das empfiehlt sich zum Beispiel, wenn auszulesende Elemente nah beieinander liegen, da die automatisch erstellten Regionen großzügig angelegt werden.
Mit OK wird das Training gespeichert. Mit Abbrechen wird die Bearbeitung abgebrochen und alle bisher gemachten Eingaben gelöscht. Das Dokument bleibt im Schritt Training stehen. Mit Übernehmen werden die bereits getätigten Eingaben zwischengespeichert. So kann das Training unterbrochen werden, um ein anderes Dokument mit höherer Priorität zu bearbeiten.
Die hier definierten Eigenschaften gelten ausschließlich für das ausgewählte Dokument. Konfigurationen im agorum core docform Dokumenttyp bleiben von dieser Änderung unbeeinträchtigt.
Sie haben jederzeit die Möglichkeit, ein Dokument auch ohne die Unterstützung des Assistenten manuell zu bearbeiten. Dies bietet sich beispielsweise bei einem optionalen Feld an.
Klicken Sie mit der rechten Maustaste im Fenster Vorschau auf den Text und wählen Sie im Kontextmenü die gewünschte Funktion. agorum core docform erstellt dann automatisch eine neue Region und legt einen neuen Eintrag in Ihrem Elemente-Baum auf der rechten Seite an. Diesem können Sie entweder einen vorhandenen oder einen neuen Namen geben. Zudem können Sie, sofern im Dokumenttyp Metadaten für diesen Typ hinterlegt sind, ein passendes Metadatum ausgewählen.
Besonders relevant sind die folgenden Optionen:
Möchten Sie das Dokument komplett manuell trainieren. sollten Sie mit der dritten Option beginnen. Damit legen Sie die Merkmale zur Identifizierung des Dokumentes fest. Mit Diesen Text suchen wählen Sie die Referenz aus. Mit der ersten Position fügen Sie der Referenz den auszulesenden Wert hinzu.
Diesen Text als Positionsankerpunkt verwenden ist nur relevant, wenn Sie agorum core docform positions nutzen.
Shortcuts beim manuellen Bearbeiten:
Gedrückte ALT-Taste + linke Maustaste = Suchfeld
Gedrückte ALT-Taste + mittlere Maustaste (Scrollrad) = Identifizierungsfeld
Gedrückte ALT-Taste + rechte Maustaste = Auslesefeld
Ziehen Sie die Maus über den gewünschten Text, während Sie die entsprechende Maus- und ALT-Taste gedrückt halten.
Anbei ein kleines Erklärungsvideo: