Ansatz zur selbstverbessernden Speicherfähigkeit in lokalen KI-Agenten

Speicherarchitektur für persistente KI-Agenten
Ein Entwickler auf r/LocalLLaMA hat seinen Ansatz geteilt, um KI-Agenten zu erstellen, die Fehler nicht über Sitzungen hinweg wiederholen. Das Kernproblem, das angegangen wird, ist, dass jede Sitzung bei Null beginnt, Kontextfenster zurückgesetzt werden und Korrekturen zwischen den Sitzungen verloren gehen.
Speicherimplementierung
Das System verwendet Markdown als Single Source of Truth anstelle einer Datenbank. MEMORY.md ist von Menschen bearbeitbar – lösche eine Zeile in vim und der Agent vergisst sie. SQLite und FAISS (HNSW, 768-dim) sind abgeleitete Caches, die jederzeit aus Markdown neu aufgebaut werden können. Dies ermöglicht es Benutzern, den Speicher ihres Agenten mit git zu versionieren.
Episodenbewertung und Regellernen
Jede Ausführung erhält eine Bewertung von +1/-1 und wird als Episode gespeichert. Bei ähnlichen zukünftigen Aufgaben werden relevante Episoden in den Kontext gezogen. Wenn die gleiche Fehlersignatur (SHA256 von Werkzeugname + normalisierter Fehler) zweimal innerhalb von 7 Tagen auftaucht, generiert ein Regellerner eine einzeilige Präventionsregel.
Regeln starten mit 0,40 Konfidenz und benötigen 0,60, um tatsächlich in zukünftige Prompts injiziert zu werden. Erfolg erhöht die Konfidenz um +0,03, Misserfolg senkt sie um -0,05. Regeln, die nicht helfen, zerfallen schließlich.
Vertrauenseskalationssystem
Anstatt Berechtigungsebenen im Voraus zu konfigurieren, verfolgt der Agent Genehmigungsmuster. 5 Genehmigungen mit 90%+ Rate = automatische Beförderung. Eine Rücknahme = Zurückstufung. Es gibt einen Schattenmodus zur Überwachung.
Aufgabenzersetzung und Sicherheit
Komplexe Ziele werden zu einem DAG (gerichteter azyklischer Graph). Zirkuläre Abhängigkeiten werden über topologische Sortierung erkannt, Fehlerkaskaden werden zu abhängigen Knoten via DFS (Tiefensuche) weitergegeben. Ein Abschlusstor prüft 18 Anforderungen (R01-R18) – hat der Agent tatsächlich Dateien gelesen, Änderungen geschrieben, Ergebnisse verifiziert, im Arbeitsbereich geblieben?
Sicherheitsfunktionen umfassen 43 Bash-Risikomuster, Dual-Pass-Analyse (roh + dekodiert), Fail-Closed-Design (Guardian-Absturz = Verweigerung) und eine minimale beschreibbare Tiefe von 3, um rm -rf / zu verhindern.
Der Entwickler sucht Feedback dazu, ob der Konfidenzzerfall bei Regeln richtig erscheint und ob die Asymmetrie von +0,03/-0,05 optimal ist. Er fragt sich auch, ob es bessere Alternativen zu HNSW für diesen Umfang gibt (typischerweise <10k Episoden).
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Sitefire automatisiert die KI-Suchoptimierung mit Content Agents.
Die Plattform von Sitefire überwacht KI-Suchergebnisse, analysiert, welche Seiten zitiert werden, und nutzt Content-Agenten, um Verbesserungen zu entwerfen oder neue Seiten zu erstellen, die direkt in das CMS der Kunden übertragen werden. Ein Kunde verzeichnete einen Anstieg der KI-Bot-Anfragen von ~200/Tag auf ~570/Tag innerhalb von zehn Tagen.

Stille Werkzeugfehler bei Codierungsagenten: Ein versteckter Effizienzverlust
Coding-Agenten stoßen oft auf Tool-Fehler, die unbemerkt bleiben, weil sie auf alternative Strategien zurückgreifen, was Tokens verschwendet und die Qualität reduziert. Das Open-Source-Tool Vibeyard erkennt diese Fehler und schlägt Korrekturen vor.

Claude Code Ultracode-Modus erzeugt 70-Agenten-Pipeline für Tiefensuche
Eine einzelne 'Deep Search'-Anfrage im Ultracode-Modus von Claude Code erzeugte automatisch eine 4-Phasen-Pipeline mit ~70 Agents, die jeweils eigenständig Projekte abrufen und abgleichen. Das Orchestrierungsskript hält Zwischenergebnisse aus dem Kontextfenster fern und verhindert so eine Kontextüberlastung.

Anthropics Multi-Agent-Harness-Design zur Verbesserung der Codequalität von Claude
Anthropics Blogbeitrag beschreibt ein Harness-Design mit mehreren Agenten, um Claudes Kontextangst und Selbstbewertungsverzerrung anzugehen, mit spezifischen Agentenrollen und Bewertungskriterien für Frontend- und Full-Stack-Entwicklung.