Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > Übersicht tags > Indexierung
Dokumente werden in folgenden Fällen konvertiert:
Wenn die HTML-Konvertierung aufgerufen wird, aber nicht vorhanden ist, wird alternativ die TXT-Konvertierung verwendet. Damit erkennen Sie, was in den Textindex einfließt.
Der extrahierte Text wird indiziert. Wenn das PDF keinen extrahierbaren Text liefert, wird es automatisch zum OCR weitergeleitet. Somit können auch „Bild-PDFs“ (etwa von einem Scanner) volltextindiziert werden.
Der extrahierte Text wird indiziert und für die Volltextsuche verwendet. Falls die OCR verwendet wird, werden auch Bildformate (*) in TXT gewandelt und indiziert.
OpenOffice ist eine der agorum core-Komponenten und wird u. a. zur Dokumentenkonvertierung und zur Generierung der Vorschau über das Modul agorum core preview verwendet. Dieses Modul ermöglicht eine Anzeige des Dokuments, ohne dass das eigentlich dafür benötigte Programm verwendet wird.
OpenOffice können Sie durch einen gleichwertigen Konverter, etwa LibreOffice, ersetzen.
MAIN_MODULE_MANAGEMENT/documentservice/control/services/settings/openoffice/OfficeProcess/Windows
In Unix MAIN_MODULE_MANAGEMENT/documentservice/control/services/settings/openoffice/OfficeProcess
/Unix
<Pfad zu Libre Office>/libreoffice/program/...Die Parameter von OpenOffice können dabei bestehen bleiben.