Claude Codes dateibasiertes Speichersystem: Eine pragmatische Alternative zu Vektor-Datenbanken

Claude Code verwendet einen dateibasierten Ansatz für Agentenspeicher, der die typische Vektordatenbank- und Embedding-Einrichtung ersetzt. Anstatt vollständiges RAG zu nutzen, speichert es Erinnerungen als .md-Dateien mit kleinen Frontmatter-Abschnitten, die Name, Beschreibung und Typinformationen enthalten, plus einer MEMORY.md-Datei, die als Index fungiert.
Wie das System funktioniert
Zur Laufzeit embeddet oder durchsucht das System nicht alles. Es folgt diesem Prozess:
- Scannt Speicherdateien (begrenzt auf etwa 200, neueste zuerst)
- Liest nur die ersten ~30 Zeilen (hauptsächlich Metadaten)
- Erstellt ein leichtgewichtiges Manifest
- Verwendet ein kleines Modell, um die ~5 relevantesten Erinnerungen auszuwählen
- Lädt nur diese ausgewählten Erinnerungen in den Kontext (mit Größenbeschränkungen)
Wesentliche Vorteile
Das Design bietet mehrere praktische Vorteile:
- Kosteneffizient: Begrenzte Dateien, begrenzte Tokens, vorhersehbare Kosten
- Schnell: Keine Embedding- oder Ähnlichkeitssuchoperationen
- Kontrolliert: Injiziert nur wenige Erinnerungen mit harten Grenzen überall
- Menschenlesbar: Alles wird als Markdown-Dateien gespeichert
- Weniger Müll: Vermeidet explizit das Speichern von Informationen, die bereits aus dem Repository abgeleitet werden können
Das System behandelt Speicher als "möglicherweise veraltet" anstatt als absolute Wahrheit, was einen erfrischenden Ansatz für das Agentenspeichermanagement bietet. Dieses Design ist besonders pragmatisch für Programmier- und Debugging-Agenten, bei denen der meiste "Speicher" aus Präferenzen, Kontext oder externen Referenzen besteht, anstatt aus großen Wissensdatenbanken.
Während dieser Ansatz RAG für alle Anwendungsfälle nicht ersetzt, stellt er einen soliden Kompromiss für Entwicklungsagenten dar, bei denen Einfachheit und Vorhersehbarkeit wichtiger sind als umfassende Wissensabfrage.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Routine-Arbeiten von Claude Code an Gemma über den offload-mcp MCP-Server auslagern
offload-mcp ist ein neuer MCP-Server, der es Claude ermöglicht, Routinetätigkeiten wie Commit-Nachrichten und PR-Zusammenfassungen an kostenlose Modell-APIs (Standardmäßig Gemma über die Google GenAI API) auszulagern. Dadurch werden Claude-Token gespart und leichte Arbeiten ohne lokale Hardwareeinschränkungen erledigt.

Claude Code v2.1.139 führt den /goal-Befehl für asynchrone langlebige Aufgaben ein
Claude Code v2.1.139 führt den /goal-Befehl ein, der Fire-and-Forget-Sitzungen ermöglicht, die bis zum Erreichen einer Abschlussbedingung laufen, sowie eine neue Agentenansicht zur Überwachung aktiver Sitzungen.

ToolLoop: Open-Source Agenten-Framework für Claude-ähnliche Tools mit beliebigen Modellen
ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen mitten im Gespräch mit gemeinsamem Kontext.

Effizientes Token-Management mit Open-Source-MCP-Servern: Pare
Pare MCP-Server reduzieren Token-Abfälle und verbessern die Effizienz, wenn KI-Coding-Agenten Entwicklertools nutzen, indem sie strukturierte Ausgaben bereitstellen.