So nutzt du Markdown als Persistent Storage für lokale KI-Agenten

Speicherarchitektur für persistente KI-Agenten

Ein Entwickler auf r/LocalLLaMA hat seinen Ansatz geteilt, um KI-Agenten zu erstellen, die Fehler nicht über Sitzungen hinweg wiederholen. Das Kernproblem, das angegangen wird, ist, dass jede Sitzung bei Null beginnt, Kontextfenster zurückgesetzt werden und Korrekturen zwischen den Sitzungen verloren gehen.

Speicherimplementierung

Das System verwendet Markdown als Single Source of Truth anstelle einer Datenbank. MEMORY.md ist von Menschen bearbeitbar – lösche eine Zeile in vim und der Agent vergisst sie. SQLite und FAISS (HNSW, 768-dim) sind abgeleitete Caches, die jederzeit aus Markdown neu aufgebaut werden können. Dies ermöglicht es Benutzern, den Speicher ihres Agenten mit git zu versionieren.

Episodenbewertung und Regellernen

Jede Ausführung erhält eine Bewertung von +1/-1 und wird als Episode gespeichert. Bei ähnlichen zukünftigen Aufgaben werden relevante Episoden in den Kontext gezogen. Wenn die gleiche Fehlersignatur (SHA256 von Werkzeugname + normalisierter Fehler) zweimal innerhalb von 7 Tagen auftaucht, generiert ein Regellerner eine einzeilige Präventionsregel.

Regeln starten mit 0,40 Konfidenz und benötigen 0,60, um tatsächlich in zukünftige Prompts injiziert zu werden. Erfolg erhöht die Konfidenz um +0,03, Misserfolg senkt sie um -0,05. Regeln, die nicht helfen, zerfallen schließlich.

Vertrauenseskalationssystem

Anstatt Berechtigungsebenen im Voraus zu konfigurieren, verfolgt der Agent Genehmigungsmuster. 5 Genehmigungen mit 90%+ Rate = automatische Beförderung. Eine Rücknahme = Zurückstufung. Es gibt einen Schattenmodus zur Überwachung.

Aufgabenzersetzung und Sicherheit

Komplexe Ziele werden zu einem DAG (gerichteter azyklischer Graph). Zirkuläre Abhängigkeiten werden über topologische Sortierung erkannt, Fehlerkaskaden werden zu abhängigen Knoten via DFS (Tiefensuche) weitergegeben. Ein Abschlusstor prüft 18 Anforderungen (R01-R18) – hat der Agent tatsächlich Dateien gelesen, Änderungen geschrieben, Ergebnisse verifiziert, im Arbeitsbereich geblieben?

Sicherheitsfunktionen umfassen 43 Bash-Risikomuster, Dual-Pass-Analyse (roh + dekodiert), Fail-Closed-Design (Guardian-Absturz = Verweigerung) und eine minimale beschreibbare Tiefe von 3, um rm -rf / zu verhindern.

Der Entwickler sucht Feedback dazu, ob der Konfidenzzerfall bei Regeln richtig erscheint und ob die Asymmetrie von +0,03/-0,05 optimal ist. Er fragt sich auch, ob es bessere Alternativen zu HNSW für diesen Umfang gibt (typischerweise <10k Episoden).

📖 Read the full source: r/LocalLLaMA