Ansatz zur selbstverbessernden Speicherfähigkeit in lokalen KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 15. April 2026🔗 Source
Ansatz zur selbstverbessernden Speicherfähigkeit in lokalen KI-Agenten
Ad

Speicherarchitektur für persistente KI-Agenten

Ein Entwickler auf r/LocalLLaMA hat seinen Ansatz geteilt, um KI-Agenten zu erstellen, die Fehler nicht über Sitzungen hinweg wiederholen. Das Kernproblem, das angegangen wird, ist, dass jede Sitzung bei Null beginnt, Kontextfenster zurückgesetzt werden und Korrekturen zwischen den Sitzungen verloren gehen.

Speicherimplementierung

Das System verwendet Markdown als Single Source of Truth anstelle einer Datenbank. MEMORY.md ist von Menschen bearbeitbar – lösche eine Zeile in vim und der Agent vergisst sie. SQLite und FAISS (HNSW, 768-dim) sind abgeleitete Caches, die jederzeit aus Markdown neu aufgebaut werden können. Dies ermöglicht es Benutzern, den Speicher ihres Agenten mit git zu versionieren.

Episodenbewertung und Regellernen

Jede Ausführung erhält eine Bewertung von +1/-1 und wird als Episode gespeichert. Bei ähnlichen zukünftigen Aufgaben werden relevante Episoden in den Kontext gezogen. Wenn die gleiche Fehlersignatur (SHA256 von Werkzeugname + normalisierter Fehler) zweimal innerhalb von 7 Tagen auftaucht, generiert ein Regellerner eine einzeilige Präventionsregel.

Regeln starten mit 0,40 Konfidenz und benötigen 0,60, um tatsächlich in zukünftige Prompts injiziert zu werden. Erfolg erhöht die Konfidenz um +0,03, Misserfolg senkt sie um -0,05. Regeln, die nicht helfen, zerfallen schließlich.

Ad

Vertrauenseskalationssystem

Anstatt Berechtigungsebenen im Voraus zu konfigurieren, verfolgt der Agent Genehmigungsmuster. 5 Genehmigungen mit 90%+ Rate = automatische Beförderung. Eine Rücknahme = Zurückstufung. Es gibt einen Schattenmodus zur Überwachung.

Aufgabenzersetzung und Sicherheit

Komplexe Ziele werden zu einem DAG (gerichteter azyklischer Graph). Zirkuläre Abhängigkeiten werden über topologische Sortierung erkannt, Fehlerkaskaden werden zu abhängigen Knoten via DFS (Tiefensuche) weitergegeben. Ein Abschlusstor prüft 18 Anforderungen (R01-R18) – hat der Agent tatsächlich Dateien gelesen, Änderungen geschrieben, Ergebnisse verifiziert, im Arbeitsbereich geblieben?

Sicherheitsfunktionen umfassen 43 Bash-Risikomuster, Dual-Pass-Analyse (roh + dekodiert), Fail-Closed-Design (Guardian-Absturz = Verweigerung) und eine minimale beschreibbare Tiefe von 3, um rm -rf / zu verhindern.

Der Entwickler sucht Feedback dazu, ob der Konfidenzzerfall bei Regeln richtig erscheint und ob die Asymmetrie von +0,03/-0,05 optimal ist. Er fragt sich auch, ob es bessere Alternativen zu HNSW für diesen Umfang gibt (typischerweise <10k Episoden).

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Sitefire automatisiert die KI-Suchoptimierung mit Content Agents.
Werkzeuge

Sitefire automatisiert die KI-Suchoptimierung mit Content Agents.

Die Plattform von Sitefire überwacht KI-Suchergebnisse, analysiert, welche Seiten zitiert werden, und nutzt Content-Agenten, um Verbesserungen zu entwerfen oder neue Seiten zu erstellen, die direkt in das CMS der Kunden übertragen werden. Ein Kunde verzeichnete einen Anstieg der KI-Bot-Anfragen von ~200/Tag auf ~570/Tag innerhalb von zehn Tagen.

OpenClawRadar
Stille Werkzeugfehler bei Codierungsagenten: Ein versteckter Effizienzverlust
Werkzeuge

Stille Werkzeugfehler bei Codierungsagenten: Ein versteckter Effizienzverlust

Coding-Agenten stoßen oft auf Tool-Fehler, die unbemerkt bleiben, weil sie auf alternative Strategien zurückgreifen, was Tokens verschwendet und die Qualität reduziert. Das Open-Source-Tool Vibeyard erkennt diese Fehler und schlägt Korrekturen vor.

OpenClawRadar
Claude Code Ultracode-Modus erzeugt 70-Agenten-Pipeline für Tiefensuche
Werkzeuge

Claude Code Ultracode-Modus erzeugt 70-Agenten-Pipeline für Tiefensuche

Eine einzelne 'Deep Search'-Anfrage im Ultracode-Modus von Claude Code erzeugte automatisch eine 4-Phasen-Pipeline mit ~70 Agents, die jeweils eigenständig Projekte abrufen und abgleichen. Das Orchestrierungsskript hält Zwischenergebnisse aus dem Kontextfenster fern und verhindert so eine Kontextüberlastung.

OpenClawRadar
Anthropics Multi-Agent-Harness-Design zur Verbesserung der Codequalität von Claude
Werkzeuge

Anthropics Multi-Agent-Harness-Design zur Verbesserung der Codequalität von Claude

Anthropics Blogbeitrag beschreibt ein Harness-Design mit mehreren Agenten, um Claudes Kontextangst und Selbstbewertungsverzerrung anzugehen, mit spezifischen Agentenrollen und Bewertungskriterien für Frontend- und Full-Stack-Entwicklung.

OpenClawRadar