Open Source Dokumentenmanagement
Dokumentation

Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht

Navigation: Dokumentationen agorum core > agorum core docform


Extraktoren in docform

Während eines docform Trainings lesen Sie bestimmte Bereiche auf dem Dokument aus. Dies gelingt durch Ausleseelemente, erkennbar an dem Diskettensymbol:

 

In den Einstellungen dieser Auslesekästchen steht Ihnen die Extraktion mit Extraktoren zur Verfügung. Durch diese können Sie den ausgelesenen Text leicht anpassen, bzw. den Ausleseprozess mit Automatismen versehen.

Wie in dem folgenden GIF zu sehen ist, wurde im Dokument das Rechnungsdatum mit dem Wert 25.11.2018 markiert. Durch die Anpassung eines Extraktors wandelt docform diesen Text um. Beispielsweise:

 

Muss ich als Anwender den Extraktor immer anpassen?


Nein, idealerweise wurde die perfekte und gewünschte Einstellung bereits von Ihrem Entwickler getroffen und bei den Dokumententypen korrekt vordefiniert (undefined>agorum core docform - Dokumententypen). In der Regel passen Sie, als Anwender, in einem docform-Training den Extraktor nur bei Sonderfällen an.

Was ist ein Extraktor?


Ein Extraktor ist ein JavaScript, dass im Hintergrund aufgerufen wird. Als Übergabeparameter wird diesem Skript unter anderem der Wert des Auslesefelds übergeben und dadurch verarbeitet.

Bedeutung der mitgelieferten Extraktoren im docform-Training


Wie Sie bereits festgestellt haben, wird agorum core mit einer Vielzahl an nutzbaren Extraktoren ausgeliefert. In diesem Abschnitt wird Ihnen deren Funktionsweise erläutert.

Hinweis: In agorum core 11 wurden für Neuinstallationen unvollständige und ungenutzte Extraktoren entfernt. Wenn Sie Bestandskunde sind und Ihr agorum core nur aktualisiert worden ist, sind diese Extraktoren in Ihrem System eventuell noch vorhanden. Folgende Extraktoren können Sie ignorieren oder von Ihrem IT-Team entfernen lassen:

  • Bestellnummer

  • IBAN

  • Mengeneinheit

  • Preiseinheit

  • Teilenummer

  • UstID

  • Währung mit Konvertierung

  • Parameter-Test

Extraktor - Zeichenkette (alphanumerisch)

Alle Zeichen des gesetzten Auslesefeldes werden übernommen. Es findet keine Umwandlung statt.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)

Extraktor -  Numerische Zeichenkette

Das System übernimmt aus dem Auslesefeld nur Zeichenketten aus den Ziffern von 0-9.

Beispiele:

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)

Extraktor -  Alphanumerische Zeichenkette

Es wurden Zeichenketten bestehende aus A-Z a-z 0-9 übernommen. Sobald ein Sonderzeichen (beispielsweise Punkt, Komma oder Klammer) erscheint stoppt der Ausleseprozess.

Beispiele:

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)

Extraktor -  Ganzzahl

Der Extraktor wandelt eine Zahl in eine Ganzzahl um. Auch Minuszeichen werden erkannt und übernommen. Das Minus kann dabei vor und hinter der Zahl stehen

Beispiele:

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

long (Ganzzahl)

Extraktor -  Dezimalzahl

Dieser Extraktor Dezimalzahlen werden extrahiert. z.B. 102,09

Parameter:

Je nach Nationalität existieren verschiedene Dezimal- und Tausendertrennzeichen. Deshalb können Sie einen zusätzlichen Parameter zum Identifizieren der länderspezifischen Schreibweise angegeben, z.B.:

Deutschland:    1.000.000,00    Parameter: `de-DE`
U.S.A. :        1,000,000.00    Parameter: `en-US`
Schweiz:        1'000'000.00    Parameter: `de-CH`

Bei allen drei Beispielen wird 1.000.000,00 als Wert ausgegeben.

Hinweis: Tragen Sie keinen Parameter ein, nutzt der Extraktor de-DE als Gebietsschema (Supported Locales). Ein davon abweichender Parameter wird jedoch priorisiert behandelt. Die Priorität gestaltet sich so:

  1. Explizite Angabe im Training
  2. Angabe unter MAIN_MODULE_MANAGEMENT/docform/control/DefaultLocale
  3. Sonst Standard: de-DE

Wie Sie Parameter im Training eintragen können, sehen Sie hier:

 

Art des Rückgabewertes:

double (Dezimalzahl)

Extraktor -  Datum

Übernahme des Datums. Der Extraktor unterstützt folgende Formate:

23 Januar 17
2017 Januar 23
23 Januar 2017
23 Jan 2017
23.01.2017
31.1.2017

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

date (Datum)

Extraktor -  Währung

Vom markierten Bereich werden (negative/positive) Zahlen mit und ohne Minus (vor und hinter der Zahl), Kommas und Punkte ausgelesen.

Parameter:

Je nach Nationalität existieren verschiedene Dezimal- und Tausendertrennzeichen. Deshalb können Sie einen zusätzlichen Parameter zum Identifizieren der länderspezifischen Schreibweise angegeben, z.B.:

Deutschland:    1.000.000,00    Parameter: `de-DE`
U.S.A. :        1,000,000.00    Parameter: `en-US`
Schweiz:        1'000'000.00    Parameter: `de-CH`

Bei allen drei Beispielen wird 1.000.000,00 als Wert ausgegeben.

Hinweis: Tragen Sie keinen Parameter ein, nutzt der Extraktor de-DE als Gebietsschema (Supported Locales). Ein davon abweichender Parameter wird jedoch priorisiert behandelt. Die Priorität gestaltet sich so:

  1. Explizite Angabe im Training
  2. Angabe unter MAIN_MODULE_MANAGEMENT/docform/control/DefaultLocale
  3. Sonst Standard: de-DE

Art des Rückgabewertes:

double (Dezimalzahl)

Extraktor -  Regulärer Ausdruck

Definition eines regulären Ausdrucks, um ein gewisses Format auszulesen.

Parameter:

Sie tragen Ihren regulären Ausdruck bei den Parametern ein, siehe auch: Regular Expressions

 

Art des Rückgabewertes:

string (Zeichenkette)

Extraktor -  Datumstreifen

Der Datumstreifen ist ein sehr spezieller und inspirierender Extraktor, mit dem wir das Problem, dass kein OCR Handschriften erkennen kann, umgehen. In diesem Fall entstand der Datumstreifen in Zusammenarbeit mit einem Bestandskunden: Dieser lässt Dokumente aus der Produktion gegen docform laufen, die ein Datumswert enthalten müssen. Dieser Wert kann nur handschriftlich gesetzt werden. Um jedoch einen automatisierten Ausleseprozess zu ermöglichen, wurde in Zusammenarbeit folgendes Layout des auszufüllenden Dokumentes entwickelt:

 

Die Mitarbeiter streichen im Alltag das aktuelle Datum weg:

 

Das Dokument wird eingecsannt, an docform geschickt und mit folgendem Trainingsaufbau ausgelesen:

 

Parameter:

Als Parameter tragen Sie das Startjahr und Endjahr ein, getrennt durch ein Leerzeichen:

<Startjahr> <Endjahr>

Art des Rückgabewertes:

date (Datum)

Tipp: Probieren Sie den Extraktor mit unseren Beispieldokumenten aus:

  • undefined>Beispieldatumstreifen.docx
  • undefined>scan_Beispiel zum Datumstreifen mit durchgestrichenen Datum.pdf​​​​​​

Hinweise:

  • Theoretisch kann dasselbe Prinzip auch bei Umfragen, oder anderen Dokumenten greifen, bei denen handschriftliche Werte ausgelesen werden müssen. Kommen Sie bei einem Bedarf gerne auf uns zu! Wir finden eine Lösung!
  • Damit der Extraktor Datumstreifen, das Datum korrekt erkennen kann, sind folgende Punkte zu beachten:
    • Es darf wirklich nur das entsprechende Datum, und kein anderer Wert weggestrichen werden
    • Es ist wichtig, eine Computerschrift auszuwählen bei der der OCR keine Probleme hat die Zahlen 1 und 7 zu erkennen. In dem folgenden Beispiel ist dies nicht gelungen, und die 13 und 21 konnte nicht gut erkannt werden. In einem solchen Fall schlägt auch der Ausleseprozess beim Datumstreifen fehl. Solche "Variablen" müsste man in Zukunft besser abfangen. Kommen Sie daher bitte auf uns zu, wenn Sie damit Probleme haben:
Es ist wichtig, für den Datumstreifen, dass die Zahlen richtig erkannt werden

 

Extraktor -  JavaScript

Der Extraktor JavaScript erlaubt es, eigene kleine JavaScripte einzufügen. Ausführliche Beispiele finden Sie in folgenden Dokumentationen:

Dabei erfahren Sie, dass der Wert aus unserem Auslesefeld als Parameter value verwendet werden wird. value ist dabei ein String. Egal ob Sie ein Datumsfeld, eine Zahl oder ähnliches auslesen. Sie müssen in dem JavaScript darauf achten, dass Sie eine Datentyp-Umwandlung vornehmen.

Parameter:

Als Parameter tragen Sie das entsprechende JavaScript ein. Dabei verarbeiten Sie die Variable value. In dieser liegt als Zeichenkette der, im Auslesefeld, vorliegende Text  vor.

Art des Rückgabewertes:

Im Standard wird eine Zeichenkette zurückgegeben. Sie können den return-Wert jedoch leicht in jeden anderen Metadatentyp mit Unterstützung von JavaScript-Modul "ac" transformieren​​​​​​.

Extraktor -  Ja/Nein-Wert

Dieser Extraktor gibt einen Ja/Nein- bzw. True/False-Wert zurück. Sehr praktisch beispielsweise für Umfragen, oder Archivierungsdeckblätter, die digital oder handschriftlich ausgelesen werden. Anbei Beispiele:

Beispiel - True wenn Hund ausgewählt wurde.png
In diesem Beispiel wird der Wert Wahr / Ja / true beim Metadatum gesetzt, wenn der ausgelesenen Wert "Hund" ist. Jeder andere angegebene Wert, wie zum Beispiel "Katze", "Nilpferd", "Frosch", etc. wird zu Falsch / Nein / false.

 

Beispiel - false, wenn docform [ ] erkennt, ist dies nicht der Fall, wird der Wert true ausgegeben.png

Uns liegt eine Ja/Nein-Frage vor: Findest du docform klasse? Um herauszufinden, welche Angabe der Befragte getroffen hat, lesen wir nur die Klammer des Ja-Kästchens aus. Wenn docform die Klammern [ ] erkennen kann, hat die Person nicht das Ja-Kästchen angehakt. Ein Kullistrich zerstört nämlich das Klammer-Format, wir gehen somit davon aus, dass Nein angehakt wurde. Wenn docform nicht die eckigen Klammern erkennen kann, dann hat der Befragte das Ja-Kästchen angestrichen, wie in dem Screenshot zu sehen ist. Die Klammern können nicht mehr ausgelesen werden. Daher ist unsere Ausgabe true.

Tipp: Probieren Sie den Extraktor mit unseren Beispieldokumenten aus:

  • undefined>scan_Beispiel zum Extraktor Ja-Nein-Wert.pdf
  • undefined>Extraktor Ja-Nein-Wert.docx

Parameter:

Als Parameter übergeben Sie eine Bedingung anhand der Extraktor entscheiden kann, welcher return-Wert zurückgegeben wird. Anbei ein paar Beispiele:

Bei einem Prüfprotokoll werden durchgeführte Prüfungen angekreuzt. Das entsprechende Feld im Dokument ist eine 0. Mit Angabe des folgenden Parameters wird bestimmt, dass bei Erkennung einer 0, O oder o der Wert false ist:

false=[0Oo]

Wird ein anderes Zeichen erkannt (Prüfer hat eine Stelle angekreuzt), ist der Wert true.

true=Netto
true=(Netto|MwSt.)

Art des Rückgabewertes:

boolean (Boolean)

Extraktor – Dezimalzahl (2 Nachkommastellen)

Der Extraktor gibt eine Dezimalzahl mit 2 Nachkommastellen aus und rundet bei Bedarf die Nachkommastellen auf.

Parameter:

Je nach Nationalität existieren verschiedene Dezimal- und Tausendertrennzeichen. Deshalb können Sie einen zusätzlichen Parameter zum Identifizieren der länderspezifischen Schreibweise angegeben, z.B.:

Deutschland:    1.000.000,00    Parameter: `de-DE`
U.S.A. :        1,000,000.00    Parameter: `en-US`
Schweiz:        1'000'000.00    Parameter: `de-CH`

Bei allen drei Beispielen wird 1.000.000,00 als Wert ausgegeben.

Hinweis: Tragen Sie keinen Parameter ein, nutzt der Extraktor de-DE als Gebietsschema (Supported Locales). Ein davon abweichender Parameter wird jedoch priorisiert behandelt. Die Priorität gestaltet sich so:

  1. Explizite Angabe im Training
  2. Angabe unter MAIN_MODULE_MANAGEMENT/docform/control/DefaultLocale
  3. Sonst Standard: de-DE

Art des Rückgabewertes:

double (Dezimalzahl)

Extraktor – Dezimalzahl (erweitert)

Eine Dezimalzahl mit so vielen Nachkommastellen, wie sie im Dokument vorhanden ist.

Wenn Sie in einem Training kein Auslesefeld definieren, also keinen bestimmten Bereich in Ihrem Papierdokument markieren, das das System auslesen soll, so setzt dieser Extraktor automatisch eine 0 in das Auslesefeld.

Parameter:

Je nach Nationalität existieren verschiedene Dezimal- und Tausendertrennzeichen. Deshalb können Sie einen zusätzlichen Parameter zum Identifizieren der länderspezifischen Schreibweise angegeben, z.B.:

Deutschland:    1.000.000,00    Parameter: `de-DE`
U.S.A. :        1,000,000.00    Parameter: `en-US`
Schweiz:        1'000'000.00    Parameter: `de-CH`

Bei allen drei Beispielen wird 1.000.000,00 als Wert ausgegeben.

Hinweis: Tragen Sie keinen Parameter ein, nutzt der Extraktor de-DE als Gebietsschema (Supported Locales). Ein davon abweichender Parameter wird jedoch priorisiert behandelt. Die Priorität gestaltet sich so:

  1. Explizite Angabe im Training
  2. Angabe unter MAIN_MODULE_MANAGEMENT/docform/control/DefaultLocale
  3. Sonst Standard: de-DE

Art des Rückgabewertes:

double (Dezimalzahl)

Extraktor – Zahlungsziel "Tage netto"

Liegt das Zahlungsziel in diesem Format vor <Zahl> Tage Netto (Leerzeichen sind optional) ist dieser Extraktor für Sie interessant.

Beispiele:

Lesen Sie diesen Text aus, wird Ihnen nur die Zahl (15, 5698 oder 3) ausgegeben.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

long (Ganzzahl)

Extraktor – Datum (letzte 8 Ziffern, ddMMyyyy)

Dieser Extraktor verarbeitet Datumswerte, die in dem Format ddMMyyyy im Dokument vorliegen, zum Beispiel 25012022. Als Rückgabewert erhalten Sie 25.01.2022.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

date (Datum)

Extraktor – Datum (yy MM dd)

Dieser Extraktor verarbeitet Datumswerte, die in dem Format yy MM dd im Dokument vorliegen, zum Beispiel 22 02 06. Als Rückgabewert erhalten Sie 06.02.2022

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

date (Datum)

Erstellung eigener Extraktoren


Achtung: Datenverlust durch Änderung der mitgelieferten Skripte. Bei Updates werden Ihre Änderungen an den mitgelieferten Skripten überschrieben. Ändern Sie die mitgelieferten Extraktoren nicht ab, sondern erstellen Sie eigene Extraktoren.

Um eigene Extraktoren anzulegen, befolgen Sie diese Schritte. Voraussetzung ist, dass Sie bereits ein eigenes Konfigurationsprojekt über den template manager angelegt haben:

  1. Öffnen Sie links in der Seitenleiste Administration.
  2. Öffnen Sie folgenden Pfad:
    MetaDb/MAIN_MODULE_MANAGEMENT/docform/control/Extractors
  3. Kopieren Sie in dieser Ebene einen bestehenden Extraktor (MetaDb Bundle), und fügen ihn an gleicher Stelle ein.
  4. Legen Sie eine MetaDb Gruppe unter Extractors an, und nennen diese wie Ihr Konfigurationsprojekt.
  5. Verschieben Sie den kopierten Extraktor in die neue Gruppe.
  6. Das kopierte Bundle wurde im Namen, um eine 1 hochgezählt. Ändern Sie diesen Namen nun um, und fügen bei Bedarf eine Beschreibung hinzu.

    Hinweis: Dieser Name ist nur für Entwickler in der MetaDb ersichtlich, genauso wie die dazugehörige Beschreibung.
  7. Öffnen Sie nun den Property-Entry Text. und ändern den Eintrag Wert (String) ab. Dies ist der displayName den Ihre Anwender in docform angezeigt bekommen.
  8. Bearbeiten Sie abschließend  den Parameter Wert (String) des Property-Entry JavaScript. In diesem Eintrag verarbeiten Sie per JavaScript den aus docform ausgelesenen Text. Dieser wird Ihnen im Parameter value übergeben.

    Tipps:
    - value ist eine Zeichenkette.
    - Sie können in dem Eingabebereich von Wert (String) ein eigenes JavaScript hinterlegen, oder auf ein bestehendes JavaScript per require() verweisen. Dieses "externe" Skript legen Sie in Ihrem Konfigurationsprojekt ab, beispielsweise:
    Eigene Dateien/Administration/customers/<Konfigurationsprojekt>/js/docform/Extraktoren/<Ihr JavaScript>.js
    - Sie können auf die Hilfsbibliothek JavaScript-Modul "ac" zugreifen. Diese ist vor allem dann hilfreich, wenn Sie den Extraktor bei einem Metadatum einsetzen, dass keine Zeichenkette ist. Wandeln Sie daher den veränderten value-Wert daher zwingend in den passenden Metadatentyp um.
  9. Idealerweise haben Sie den neuen Extraktor auf einem Testsystem erstellt und getestet. Erweitern Sie daher die export.yml, um den passenden MetaDb-Eintrag.
  10. Laden Sie den Browsertab von docform neu, um Ihren Extraktor im Trainingsschritt einsehen und nutzen zu können.

Eigene Extraktoren in metadata-collections verwenden

Sie können Ihren konfigurierten Extraktor auch in einer metadata-collection verwenden. Hierfür müssen Sie innerhalb der metadata-collection den Namen des dazugehörigen Property-Bundles angeben. Wie dies genau funktioniert, sehen Sie in den nachfolgenden Schritten anhand eines Beispiels:

  1. Öffnen Sie links in der Seitenleiste Administration und dann MetaDB.
  2. Öffnen Sie diesen Pfad:
    MAIN_MODULE_MANAGEMENT/docform/control/Extractors
  3. Wählen Sie den Extraktor aus, den Sie in der metadata-collection verwenden wollen.

    Hinweis: In diesem Beispiel ist der Extraktor in der Gruppe  und das Bundle heißt DateOrCw steht hierbei für die Auswahl zwischen Datum und der Kalenderwoche. Wie die Ordnerstruktur in der MetaDb aussieht, sehen Sie in Abbildung 1.

  4. Kopieren Sie sich den Namen des Property-Bundles (hier: DateOrCw).
  5. Öffnen Sie das Skript der gewünschten metadata-collection.

    Tipp: Sie können zum Ausprobieren gerne unsere metadata-collection-Beispiele verwenden. Diese finden Sie in dieser Dokumentation.

  6. Fügen Sie den Namen (hier: DateOrCw) in die entsprechende metadata-collection.yml ein und passen Sie auch den Wert für extractorParameters (hier: 'dd.MM.yyyy') an.

    Hinweis: Im Folgenden sehen Sie ein Beispiel dafür, wie Sie den Extraktor in einer metadata-collection angeben können:

    ...
     - delivery_date:
          docform:
            extractor: DateOrCw
            extractorParameters: 'dd.MM.yyyy'
            optional: true 
    ...
  7. Speichern Sie die angepasste metadata-collection.yml ab und führen Sie diese über Run aus.
Abbildung 1: Ordnerstruktur der MetaDb

Ausgelieferte Beispiele zur Erstellung eigener Extraktoren - Inspirationsquelle

Ihnen liegen Beispiele zur Erstellung von Extraktoren in folgendem Skript vor:

Eigene Dateien/Administration/Scripting/Libraries/docform-samples/extractor.js

Hinweis: Beachten Sie, dass diese Beispiele nicht vollständig sind und als Inspirationsquellen angesehen werden sollten!

Ob die Extraktorenbeispiele bei Ihnen in der MetaDb vorliegen, und somit gleich eingesetzt werden können, ist von Ihrer ersten eingesetzten agorum core Version abhängig:

Um die Extraktoren zu betrachten oder neu anzulegen, gehen Sie wie folgt vor:

  1. Öffnen Sie den Pfad: MetaDb/MAIN_MODULE_MANAGEMENT/docform/control/Extractors
  2. Dort liegen Ihnen nützliche Extraktoren, wie Bsp2Decimals, BspDouble, etc vor.
  3. Überprüfen Sie, ob der Beispielextraktor von Interesse vorliegt (siehe folgende Tabelle):
    Ja: Schauen Sie sich diesen an.
    Nein: Befolgen Sie die weiteren Handlungsschritte.
  4. Der Extraktor von Interesse besitzt keinen MetaDb-Eintrag. Diesen erstellen Sie nun, wie oben beschrieben neu, um den Extraktor testen zu können. Nutzen Sie dazu die Angaben aus der Spalte Einträge MetaDb der folgenden Tabelle:
    - MetaDb-Bundle Bezeichnung: Bezeichnung des Bundels, dass unter dem MetaDb zu Extractors angelegt wird.
    - JavaScript-Wert: In dem neuen Bundle legen Sie einen MetaDb Entry namens JavaScript an. Dort wird der in der Tabelle hinterlegte Wert gespeichert.
    - Text-Wert: In dem neuen Bundle legen Sie einen MetaDb Entry namens Text an. Dort wird der in der Tabelle hinterlegte Wert gespeichert.

 

Aufbau der Beispielextraktoren in der MetaDb

 

Name Einträge MetaDb Beschreibung
Teilenummer

MetaDb-Bundle Bezeichnung:

BspTeilenummer

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractTeilenummer(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

Teilenummer

Dieser Extraktor wurde beispielhaft für eine Teilnummer erstellt und liest folgende Werte basierend auf regulären Expressionen aus:

  • [LMQS]00001, Beispiel:
    • L00001
  • [NTU]\d{2}001, Beispiel:
    • NTU58001
  • R\d{3}00, Beispiel:
    • R12300
  • AN00[\dJK]\d{5}, Beispiel:
    • AN00K12345

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)
Bestellnummer

MetaDb-Bundle Bezeichnung:

BspBestellnummer

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractBestellnummer(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

Bestellnummer

Dieser Extraktor gibt eine Zeichenkette zurück, die maximal aus 7 Zeichen besteht.

Beispiel:

  • Wert des Auslesefeldes: BE6565434654654
    Wert durch Umwandlung des Extraktors: BE65654

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)
IBAN

MetaDb-Bundle Bezeichnung:

BspIBAN

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractIBAN(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

IBAN

Dieser Extraktor gibt den markierten Auslesebereich zurück, entfernt jedoch die Leerzeichen.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)
Mengeneinheit

MetaDb-Bundle Bezeichnung:

BspMengeneinheit

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractMengeneinheit(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

Mengeneinheit

Wenn folgende Bezeichnungen für eine Mengeneinheit gefunden werden, ist die Ausgabe 1:

  • E
  • ST
  • Stk

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

long (Ganzzahl)
Preiseinheit

MetaDb-Bundle Bezeichnung:

BspPreiseinheit

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractPreiseinheit(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

Preiseinheit

Wenn folgende Bezeichnungen für eine Preiseinheit gefunden werden, ist die Ausgabe 1:

  • E
  • ST
  • Stk

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

long (Ganzzahl)
UStId

MetaDb-Bundle Bezeichnung:

BspUStId

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractUStId(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

UStId

Dieser Extraktor gibt die UStId zurück. Die Umsatzsteuer-Identifikationsnummer beginnt mit zwei Großbuchstaben gefolgt von einer Zahlenfolge. Für Deutschland wurde zudem eine Korrektur eingetragen. Sollte bei einem eingescannten Dokument DE schlecht zu lesen sein, und 0E oder OE vom OCR erkannt worden sein, werden die Buchstaben automatisch in DE korrigiert.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)
Währung (mit Konvertierung)

MetaDb-Bundle Bezeichnung:

BspWaehrung

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

require('docform-samples/extractor').extractWaehrung(value)

 

MetaDb Entry namens Text und der dazugehörige Wert:

Währung (mit Konvertierung)

Statt des Währungssymbols wird das Währungskürzel ausgegeben.

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

string (Zeichenkette)
Parameter-Test

MetaDb-Bundle Bezeichnung:

paramTest

 

MetaDb Entry namens JavaScript und der dazugehörige Wert:

JSON.stringify({value:value,parameters:parameters.split('\n')})

 

MetaDb Entry namens Text und der dazugehörige Wert:

Parameter-Test

Der Extraktor ist in der MetaDb ein Property-Eintrag und besteht aus einem String:

JSON.stringify({value:value,parameters:parameters.split('\n')})

Der gesamte Wert (value) wird ausgelesen und durch einen Parameter definiert.

Er demonstriert, wie ein Exktraktor die Parameter übergeben bekommt.

Beispiel für JavaScript:

Neuen Property-Eintrag mit folgenden Angaben erstellen:

Name:               DatumTest
Property-Eintrag:   JavaScript:
JavaScript:         transform(value).date(parameters.split('\n')[0],parameters.split('\n')[1])

Im Dokumententyp wird als Parameter zusätzlich angegeben:

dd MMMM yyyy
de

Der ausgelesene Wert ist: 31 Januar 2017
Ergebnis ist: 31.01.2017

Ablageort:

MAIN_MODULE_MANAGEMENT/docform/control/Extractors/paramTest

Parameter:

Es liegen keine Einstellungsmöglichkeiten / Parameter vor.

Art des Rückgabewertes:

long (Ganzzahl)