agorum_ai_agents_library_basic_mistral_ocr

Anzeigename: Processes documents using Mistral OCR API

Hinweis: Für die Verwendung des Tools agorum_ai_agents_library_basic_mistral_ocr müssen Sie ein Sprachmodell von Mistral verwenden und den API-Key für den Zugriff in den Einstellungen des Tools hinterlegen.

Was macht das Tool?

Dieses Tool verarbeitet Dokumente mittels der Mistral OCR API. Es extrahiert den Text aus hochgeladenen Dokumenten (z.B. PDFs oder Bilder) und gibt das OCR-Ergebnis für jede Seite im Markdown-Format zurück. Optional können strukturierte Annotationen je nach angegebenem Format bereitgestellt werden.

Empfohlener Einsatzzweck

Das Tool eignet sich, um gescannte Dokumente, Bilder oder PDFs automatisiert zu digitalisieren und deren Inhalte maschinenlesbar zu machen. Besonders nützlich ist es, wenn strukturierte Informationen (z. B. Rechnungsdaten, Tabellen, Layout-Elemente) aus Dokumenten extrahiert werden sollen. Es kann in Prozessen zur automatischen Dokumentenverarbeitung, Archivierung oder Datenextraktion eingesetzt werden.

Funktionsbeschreibung

Parameter	Beschreibung
apiKey (Pflicht)	API-Key für Mistral OCR (über die Firma Mistral zu beziehen). Hinweis: Die Erstellung eines Mistral-Kontos und eines API-Keys für ein OCR-Modell ist erforderlich und ggf. kostenpflichtig.
documentUuids (Pflicht)	Array von UUIDs der zu verarbeitenden Dokumente. Mindestens eine UUID muss angegeben werden.
model (Optional)	Das zu verwendende Mistral OCR Modell. Standard: "mistral-ocr-latest".
pages (Optional)	Array von Seitenzahlen (0-basiert), die verarbeitet werden sollen. Wenn nicht angegeben, werden alle Seiten verarbeitet.
bboxAnnotationFormat (Optional)	JSON-Schema für BBox-Annotationen (z. B. für einzelne Elemente/Bilder im Dokument).
documentAnnotationFormat (Optional)	JSON-Schema für Annotationen auf Dokumentenebene (z. B. für die gesamte Dokumentstruktur).
includeImageBase64 (Optional)	Gibt an, ob base64-kodierte Bilder im Ergebnis enthalten sein sollen. Standard: false.

Tipps und Tricks

Tipps:

Für beste Ergebnisse sollten die hochgeladenen Dokumente eine möglichst gute Scanqualität aufweisen.
Die Nutzung von Annotation-Formaten ermöglicht eine gezielte Extraktion strukturierter Daten.
Beachten Sie, dass für die OCR-Erkennung über dieses Tool ein aktiver Zugang zu OpenAI erforderlich ist und ggf. Kosten entstehen können.