Durchsuchbare Dokumentation aufrufen | Zurück zur Dokumentationsübersicht

Navigation: Dokumentationen agorum core > ALBERT | AI > ALBERT | AI KI-Handler einrichten


History Compaction

Technischer Name: agorum_ai_history_compaction

Anzeigename: Compact history on demand/Historie bei Bedarf zusammenfassen

Was macht der Handler?

Der Handler agorum_ai_history_compaction ist ein KI-Handler, der die Konversationshistorie automatisch komprimiert, sobald das Kontextfenster des KI-Modells einen definierten Schwellenwert überschreitet.

Funktionsweise

Der Handler arbeitet nach folgendem Prinzip:

  1. Bei jeder Benutzeranfrage wird die aktuelle Auslastung des Kontextfensters berechnet. Dazu werden die Token-Werte (input, output, cache_read, cache_write) aus dem letzten Historieneintrag herangezogen.
  2. Die Auslastung wird prozentual mit dem maximalen Kontextfenster des verwendeten KI-Modells verglichen.
  3. Wenn die Auslastung den konfigurierten Schwellenwert überschreitet (Standard: 75%), wird eine Komprimierung ausgelöst.
  4. Für die Komprimierung wird ein spezieller Prompt verwendet, der die KI anweist, eine strukturierte Zusammenfassung des bisherigen Gesprächsverlaufs zu erstellen.
  5. Die Zusammenfassung enthält alle relevanten Informationen wie Ziele, Entscheidungen, erledigte Arbeiten, Dateireferenzen (UUIDs und Pfade) sowie offene Aufgaben.
  6. Die ursprüngliche Historie wird als "disabledForAi" markiert und die komprimierte Zusammenfassung wird als neuer Kontext eingefügt.
  7. Die Konversation wird nahtlos mit einem internen Prompt fortgesetzt, der die KI anweist, basierend auf der Zusammenfassung weiterzuarbeiten.

Empfohlener Einsatzzweck

Der Handler eignet sich besonders für:

Einstellungen

Parameter Beschreibung
Schwelle für Zusammenfassung des verbrauchten Kontext-Fensters in %
(optional)
Schwellenwert in Prozent, ab dem die Historie komprimiert wird. Wenn die Auslastung des Kontextfensters diesen Wert überschreitet, wird die Komprimierung ausgelöst.

Standard: 75

Verwendung in KI-Voreinstellungen

Der Handler kann zusammen mit anderen Handlern in einer KI-Voreinstellung verwendet werden. Bei der Reihenfolge ist Folgendes zu beachten:

Hinweis: Der Handler deaktiviert während der Komprimierung alle anderen Handler, um Endlosschleifen zu vermeiden. Die Komprimierung selbst ist ein interner KI-Aufruf, der keine externen Handler auslöst.