Durchsuchbare Dokumentation aufrufen

Zurück zur Dokumentationsübersicht

Dokumente konvertieren

Dokumente werden in folgenden Fällen konvertiert:

Informationen zur Konvertierung bei diversen Dateiformaten


HTML

Wenn die HTML-Konvertierung aufgerufen wird, aber nicht vorhanden ist, wird alternativ die TXT-Konvertierung verwendet. Damit erkennen Sie, was in den Textindex einfließt.

PDF

Der extrahierte Text wird indiziert. Wenn das PDF keinen extrahierbaren Text liefert, wird es automatisch zum OCR weitergeleitet. Somit können auch „Bild-PDFs“ (etwa von einem Scanner) volltextindiziert werden.

TXT

Der extrahierte Text wird indiziert und für die Volltextsuche verwendet. Falls die OCR verwendet wird, werden auch Bildformate (*) in TXT gewandelt und indiziert.

Dokumentenkonvertierung mit OpenOffice


OpenOffice ist eine der agorum core-Komponenten und wird u. a. zur Dokumentenkonvertierung und zur Generierung der Vorschau über das Modul agorum core preview verwendet. Dieses Modul ermöglicht eine Anzeige des Dokuments, ohne dass das eigentlich dafür benötigte Programm verwendet wird.

Den OpenOffice-Konverter ersetzen

OpenOffice können Sie durch einen gleichwertigen Konverter, etwa LibreOffice, ersetzen.

  1. Öffnen Sie in der Seitenleiste Administration und dann MetaDB.
  2. Öffnen Sie den Pfad:

    In Windows
    MAIN_MODULE_MANAGEMENT/documentservice/control/services/settings/openoffice/OfficeProcess/Windows
    
    In Unix
    MAIN_MODULE_MANAGEMENT/documentservice/control/services/settings/openoffice/OfficeProcess/Unix
    
  3. Doppelklicken Sie auf das Propert-Entry arg, um es zu bearbeiten.
  4. Ersetzen Sie den ersten Wert des String-Arrays mit dem Pfad zum neuen Dokumentenkonverter:

    Beispiel für LibeOffice
    <Pfad zu Libre Office>/libreoffice/program/...
    
    Die Parameter von OpenOffice können dabei bestehen bleiben.
  5. Starten Sie agorum core neu.