Memento Vault: Lokales Tool für dauerhaften Kontext in Claude-Code-Sitzungen

Memento Vault löst das Problem, dass Claude Code Kontexte zwischen Sitzungen vergisst, indem es automatisch relevante Informationen erfasst und abruft – ohne manuelle Wartung.
Funktionsweise
Das Tool nutzt Hooks, die in den Lebenszyklus von Claude Code eingreifen:
- Bei Sitzungsende: Ein Hook liest das Protokoll, bewertet es und entscheidet, was behalten wird. Bedeutende Sitzungen führen zu atomaren Notizen in einem lokalen Git-Repo. Jede Notiz enthält eine Idee mit Frontmatter (inklusive Zuverlässigkeitsbewertungen und Tags) sowie Wikilinks zu verwandten Notizen. Unbedeutende Sitzungen erhalten einen Einzeiler in einem Tageslog.
- Bei Sitzungsbeginn: Es injiziert eine Einführung, die Ihre letzten Projektsitzungen und die relevantesten Vault-Notizen für Ihre anstehende Arbeit anzeigt.
- Bei jeder Eingabe: Es durchsucht Ihren Vault und zeigt passende Notizen an, bevor Claude Ihre Eingabe verarbeitet.
- Bei jedem Dateizugriff: Es fügt Kontext zu Codebereichen hinzu, die Sie zuvor bearbeitet haben.
Technische Details
Alle Abfragen nutzen lokale BM25 + Vektorsuche ohne LLM-Aufrufe. Das System hat eine durchschnittliche Latenz von 472 ms pro Eingabe und verursacht keine Betriebskosten. Der Kontext-Overhead beträgt etwa 149 Eingabeeinheiten pro Sitzung. Die Abfragequalität erreicht NDCG@10 = 0.892 auf LongMemEval (500 Fragen).
Eine Hintergrund-Konsolidierungsschicht namens Inception clustert Notizen nach Ähnlichkeit der Embeddings und erstellt nach Sitzungen Muster-Notizen, die wiederkehrende Probleme über Projekte hinweg identifizieren.
Das gesamte System verwendet Markdown-Dateien in einem Git-Repo, die in Obsidian durchsuchbar, mit grep durchsuchbar und mit git log vergleichbar sind. Es gibt keine Datenbank-, Docker- oder Cloud-Abhängigkeiten.
Installation
git clone https://github.com/sandsower/memento-vault.git
cd memento-vault
./install.sh --experimentalVoraussetzungen: Python 3 und Claude Code. QMD fügt semantische Suche hinzu (optional). Läuft unter Linux und macOS.
Das Projekt umfasst 271 Tests und ist unter MIT-Lizenz veröffentlicht.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Android CLI und Fähigkeiten für KI-Agenten-Entwicklungsworkflows
Google veröffentlichte Android CLI mit Befehlen wie android create und android sdk install, plus das Android Skills GitHub-Repository mit modularen Anleitungssätzen. Interne Benchmarks zeigen eine 70%ige Reduzierung der LLM-Token-Nutzung und eine 3-mal schnellere Aufgabenabwicklung.

Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.
Für 10 US-Dollar pro Monat bietet Alibabas Plan Zugang zu den Modellen Qwen3.5-Plus, Kimi-K2.5, GLM-5 und MiniMax-M2.5 mit Kontingenten von 1.200 Anfragen pro 5 Stunden, 9.000 pro Woche und 18.000 pro Monat.

GGUF-Modell-Zusammenführungs-Skript und Workflow für Qwen3.5-35B-Varianten
Ein Reddit-Nutzer hat ein Python-Skript zum Zusammenführen von GGUF-Modelldateien mit minimalem Verlust geteilt, das speziell HauhauCS' Qwen3.5-35B-A3B-Uncensored-Modell mit samuelcardillos Claude-4.6-Opus-Reasoning-Distilled-Version kombiniert. Das Skript läuft auf Google Colab Free Tier und beinhaltet Quantisierungsunterstützung via llama-quantize.

Audacity-MCP: Claude AI-Integration für lokale Audio-Bearbeitung mit 131 Werkzeugen
Audacity-MCP verbindet Claude über eine Pipe-Schnittstelle mit Audacity und ermöglicht sprachgesteuerte Audio-Bearbeitung mit 131 Werkzeugen, 9 automatisierten Pipelines und lokaler Whisper-Transkription ohne Cloud-Abhängigkeiten.