Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht
Navigation: Dokumentationen agorum core > agorum core Module und Plugins > ALBERT | AI
Hinweis: Diese Dokumentation bezieht sich auf die aktuellsten Versionen der ALBERT | AI Plugins. Aktualisieren Sie die hier beschriebenen Plugins, um die Dokumentation verwenden zu können.
Mit dem KI-Tool whisper_transcribe können Sie Audio- und Videodateien, die in agorum core gespeichert sind, automatisch in Text umwandeln lassen. Die Transkription erfolgt über einen OpenAI-kompatiblen Whisper-Server. Das Tool wird von der KI im Chat automatisch verwendet, wenn Sie die KI bitten, eine Audio- oder Videodatei zu transkribieren.
Gehen Sie wie folgt vor, um eine Audio-Datei zu transkribieren:
Transkribiere die angehängte Audio-Datei auf Deutsch.oder:
Bitte erstelle ein Transkript der angehängten Datei.
Hinweise für die Transkription:
Das Whisper-Tool unterstützt die folgenden Audio- und Videoformate:
| Format | Dateiendung | Beschreibung |
|---|---|---|
| MP3 | .mp3 |
Weit verbreitetes Audio-Format. Unterstützt automatisches Chunking für große Dateien. |
| MP4/M4A | .mp4, .m4a |
Video- und Audio-Container-Format (AAC-Audio). |
| WAV | .wav |
Unkomprimiertes Audio-Format. |
| WebM | .webm |
Web-optimiertes Audio-/Video-Format. |
| OGG | .ogg |
Offenes Audio-Format (Vorbis/Opus). |
| FLAC | .flac |
Verlustfreies Audio-Format. |
Die Whisper-Bibliothek unterstützt automatisches Chunking für große Dateien. Wenn eine Datei das Upload-Limit des Whisper-Servers überschreitet (z. B. 10 MB oder 25 MB), wird sie automatisch in mehrere Teile zerlegt, einzeln transkribiert und das Ergebnis zu einem zusammenhängenden Text zusammengefügt.
Dieser Vorgang ist für Sie als Benutzer vollständig transparent: Sie geben eine große Datei an und erhalten den vollständigen Transkriptionstext zurück.