Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core support tool > Einführung in das agorum core support tool
In diesem Abschnitt tauchen diverse Zeilen und Spalten in einer Tabelle auf.
Spalte/Zeile | Beschreibung |
---|---|
Content queue size: creates | Definiert die Anzahl an zu erstellenden Inhalten, die sich derzeit in der Warteschlange befinden. |
Average / m | Definiert den Durchschnitt der Inhalte pro Minute. |
Delta / m | Definiert die Differenz zur letzten Prüfung in Minuten, bezogen auf die Inhalte. |
Über Checks starten Sie zwei Überprüfungen:
Dieser Check ist nur noch für Altkunden relevant.
Früher wurde agorum core mit der Suchmaschine Lucene ausgeliefert. Dieser Test überprüft die verwendete Suchmaschine und teilt Ihnen mit, ob Sie auf die Suchmaschine Solr umstellen müssen. Eine rote / orangefarbene Meldung erscheint.
Verwendet Ihr agorum core-System bereits die Suchmaschine Solr, endet dieser Test mit einem grünen Ergebnis.
Die hier aufgelisteten Checks drehen sich allesamt um das Thema Indizierung, es handelt sich um textindex queues. Anstatt Fehlermeldungen oder Warnungen auszugeben, ist dieser Test für Statistiken gedacht. Das Ergebnis wird somit immer grün dargestellt, sobald dieser durchgelaufen ist. Sie können damit etwa überprüfen, wie viele Dokumente aktuell und noch indiziert werden sollen.
Auch ein genauerer Blick auf die unterschiedlichen Indizierungsarten ist möglich.
Importieren Sie neue Dokumente oder ändern bestehende im System um, sind die dazugehörigen Informationen in der Datenbank hinterlegt. Sie möchten, ebenso wie Ihre Benutzer, nach Dokumenten suchen. Auch automatische Prozesse holen sich oftmals Ihren Arbeitsvorrat aus Solr. Für diese Funktion indiziert das System die neuen / geänderten Objekte.
Über Configurations haben Sie die Wahl zwischen folgenden Einträgen:
Zur Indizierung von Objekten gehört ebenfalls deren Volltext. Je nach Dokument liegen bereits Textinformationen vor (digital erstellte Dokumente, etwa Word, E-Mails, …), oder nicht (etwa Bilder, Scans, …). In diesem Bereich definieren Sie die dafür genutzte Threadanzahl Ihrer Serverlandschaft.
Einstellung | Beschreibung |
---|---|
Licensed | Bestätigt, dass die Angaben unter Concurrency (Standard) korrekt sind und mit der Anzahl Ihrer lizenzierten OCR-Threads / Kerne übereinstimmen. |
Concurrency (Standard) | Definiert die Anzahl an Threads, die der OCR zur Verfügung stehen. Beachten Sie die Anzahl an lizenzierten OCR-Kernen. Hinweis: Setzen Sie diesen Wert nicht auf 0. Dadurch deaktivieren Sie die OCR und es sammelt sich eine Queue an, die nicht abgearbeitet wird. |
Concurrency (Fast) | Importieren oder verändern Sie Dokumente mit Textinformationen (etwa Word-, Excel- oder PowerPoint-Dateien), werden diese ebenfalls neu indiziert, allerdings mit dem Unterschied, dass keine OCR benötigt wird. Definieren Sie in diesem Abschnitt die Threadanzahl, die Sie diesem Prozess freistellen. Hinweis: Setzen Sie diesen Wert nicht auf 0. Dadurch deaktivieren Sie die OCR und es sammelt sich eine Queue an, die nicht abgearbeitet wird. |
Wie viele Threads Sie setzen und somit eine parallele Bearbeitung aktivieren, hängt von verschiedenen Faktoren ab:
Die Index configuration bietet verschiedene Konfigurationsmöglichkeiten bezüglich der Indizierung.
Konfiguration | Beschreibung |
---|---|
indexEnabled | Aktiviert oder deaktiviert die Indizierung systemweit.
Hinweis: Lassen Sie diese Einstellung aktiviert, da andernfalls keine Dokumente mehr auffindbar sind und viele automatische Prozesse nicht mehr funktionieren. |
EngineInfo | Dieses Feld ist rein informativ und informiert Sie über die aktuell verwendete Suchmaschine. |
documentsPerTransaction | Definiert die Anzahl an Dokumenten, die innerhalb einer Transaktion indiziert werden (Standard: 500).
Hinweis: Ändern Sie diesen Wert nicht ab. Dieser hat sich im Laufe der Jahre etabliert und als performant bewährt. |
minWaitTime | Definiert, ab wann Dokumente gesammelt an den Indizierungsloop weitergereicht werden (Standard: 100 ms).
Hinweis: Ändern Sie diesen Wert nicht ab. Dieser hat sich im Laufe der Jahre etabliert und als performant bewährt. |
maxWaitTime | Die maxWaitTime ist ein Gegenspieler zur minWaitTime. Das System sammelt Objekte, ehe diese gebündelt an den Indizierungsloop weitergereicht werden. Nach maximal einer Minute (60000 ms) findet ein Cut statt, und all die darin enthaltenen Objekte werden an den Indizierungsloop weitergereicht, auch wenn neue Dokumente unterhalb der minWaitTime importiert / geändert werden. Diese zeitliche Eingrenzung erlaubt eine performante Indizierung.
Hinweis: Ändern Sie diesen Wert nicht ab. Dieser hat sich im Laufe der Jahre etabliert und als performant bewährt. |
docTextTimeout | Definiert die maximale Dauer einer Dokumentenindizierung (Standard: 900000).
Hinweis: Bei einer Anpassung müssen Sie auch das TimeOut des TextIndex / Previews anpassen. Diese Werte greifen auch, sollten Sie aus Versehen den Wert des docTextTimeoutwert geleert haben. |
maxDocSize | Definiert die maximale Byte-Anzahl der Dokumente, deren Volltext extrahiert wird. Diese Extraktion ist beschränkt, um einen OutOfMemory-Fehler zu vermeiden und hängt somit von Ihrer Hardwareausstattung sowie der Größe Ihrer Dateien ab. Die meisten Kunden verwenden bei solchen Dokumenten, die etwa maschinell erstellt werden und bis zu 10.000 Seiten lang sind, einen automatischen Trennprozess. Durch das Setzen von Metadaten kann der Volltext irrelevant werden. Sprechen Sie uns hierzu gerne an. In der MetaDb existieren weitere Möglichkeiten, um die Bearbeitung von großen Dokumenten exakter einzustellen und einen OutOfMemory-Fehler zu vermeiden. Sprechen Sie uns hierzu gerne an. |
validationLevel | Verifiziert Metadatenwerte und stellt sicher, dass nur Werte passend zum angegebenen Datentypen abgelegt werden. Etwa, dass ein Array-Metadatum auch nur Array-Werte enthält oder einem Integer-Metadatum keine Strings zugewiesen werden. Lassen Sie deshalb den Wert strict stehen. Sind Sie bereits langjähriger Kunde, kann es sein, dass Ihre Metadaten noch vermischt sind. Diese verschwinden nicht von heute auf morgen aus Ihrem System. Ändern Sie stattdessen temporär den Wert von strict auf lenient. Dadurch läuft Ihr agorum core-System in keinen Fehler. Versuchen Sie trotz dieser Lösung Ihre Metadaten zu bereinigen. Hinweis: Bei einer Neuinstallation von agorum core ab Version 9.5.1 steht diese Einstellung auf strict. Wird eine ältere Version aktualisiert, bleibt der zuvor eingestellte Wert (Standard: lenient). |
Hiermit haben Sie Zugriff auf nach Funktionsbereichen sortierte Logs. Sie greifen darauf zurück, wenn Sie etwa gezielt nach Fehlern der Volltextextraktion suchen.
Weitere Menüeinträge existieren:
In diesem Logbereich finden Sie Informationen / Logs zur Volltextextraktion.
In diesem Logbereich finden Sie Informationen / Logs zur Indizierung.
In diesem Logbereich finden Sie Informationen / Logs zur Suche.
Wenn Sie eigene Filter im agorum core information center erstellt haben und deren Suchergebnisse nicht zum Ziel führen, gehen Sie so vor:
Die Dauer einer Indizierung hängt von vielen Faktoren ab. Trotzdem kann sie berechnet werden. Dazu geht unser Support-Team folgendermaßen vor: