Lokales MCP-Speichersystem mit Konsolidierung für KI-Gespräche

Was das ist
Ein Entwickler hat ein lokales Speichersystem für KI-Gespräche geschaffen, das Informationen konsolidiert und synthetisiert, anstatt sie nur zu speichern. Als MCP-Server aufgebaut, funktioniert es mit kompatiblen Clients wie Claude Desktop und Claude Code und läuft zu 100 % lokal, ohne dass Daten Ihre Hardware verlassen.
Wie es funktioniert
Der entscheidende Unterschied zu herkömmlichen RAG-Systemen ist der Konsolidierungsprozess. Alle 6 Stunden gruppiert eine lokale LLM (Qwen 2.5-7B, die in LM Studio läuft) aktuelle Erinnerungen nach Themen und fasst sie zu strukturierten Wissensdokumenten zusammen. Sie extrahiert Fakten, Lösungen und Präferenzen, vereint sie mit bestehendem Wissen und versioniert alles.
Technischer Stack
- Embeddings: nomic-embed-text-v1.5 über LM Studio
- Vektorsuche: FAISS (semantisch + Keyword-Hybrid)
- Konsolidierungs-LLM: Qwen 2.5-7B (Q4) über LM Studio
- Speicher: SQLite für Episoden, FAISS für Vektoren
- Protokoll: MCP – funktioniert mit allem, was es unterstützt
- Konfiguration: TOML
Funktionen
- Semantische Deduplizierung mit Kosinus-Ähnlichkeitsschwelle von 0,95
- Adaptives Überraschungs-Scoring – häufig genutzte Erinnerungen werden verstärkt, veraltete verblassen
- Atomare Schreibvorgänge mit tempfile + os.replace für Absturzschutz
- Tombstone-basierte FAISS-Löschung – O(1) anstatt den gesamten Index neu aufzubauen
- Graceful Degradation – wenn LM Studio ausfällt, funktioniert die Speicherung weiter, Konsolidierung pausiert
- 88 Tests bestanden
MCP-Tools
memory_store– speichere eine Episode mit Typ, Tags, Überraschungs-Scorememory_recall– semantische Suche über Episoden + konsolidiertes Wissenmemory_forget– markiere eine Episode zur Entfernungmemory_correct– aktualisiere ein Wissensdokumentmemory_export– vollständiges JSON-Backupmemory_status– Systemstatusprüfung
Warum MCP gewählt wurde
Modelle werden häufig ersetzt, aber angesammeltes Wissen sollte nicht mit ihnen verschwinden. MCP macht den Speicher portabel – ein Speicher, viele Schnittstellen. Die Speicherschicht wird wertvoller als jedes einzelne Modell.
Praktische Ergebnisse
Nach etwa einer Woche Nutzung hat das System Wissensdokumente über PC-Hardware, VR-Einrichtung, Programmierpräferenzen und Projektarchitekturen aufgebaut – alles aus normalen Gesprächen synthetisiert. Wenn neue Chats beginnen, kennt die KI bereits den Kontext des Nutzers, ohne dass er ihn neu erklären muss.
Anforderungen
- Python 3.11+
- LM Studio mit geladenem Qwen 2.5-7B und nomic-embed-text-v1.5
- Beliebiger MCP-Client
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

EvalShift: Open-Source-CLI zur Erkennung von LLM-Regressionen bei der Modellmigration
EvalShift ist ein MIT-lizenziertes Python-CLI, das Ausgaben von Quell- vs. Ziel-LLMs über Prompts, Agents und Tool-Calling-Workflows vergleicht und einen lokalen HTML-Regressionsbericht erstellt.

Übersetze zu de: AGENTS.md Schema für LLM-kompilierte Wissensbasen mit Lernschicht
AGENTS.md v1.0 bietet einen Schema-Standard für Claude, um persönliche Forschungs-Wikis aus Rohquellen zu erstellen und zu pflegen, einschließlich einer Schicht für verteiltes Wiederholungslernen mit automatischer Erstellung von Lernkarten und Nachverfolgung von Wissenslücken.

Multi-LLM Papier-Trading-Bot mit Claude Opus als leitendem Ingenieur und Gemini als Stratege: Architekturaufschlüsselung
Ein Solo-Entwickler teilt einen 4.900-Zeilen Paper-Trading-Bot auf Alpaca, bei dem Claude Opus 4 (Engineer) ein Vetorecht gegenüber Gemini Pro (Strategist) hat, samt eines Protokolls mit über 270 Einträgen, dem sogenannten Strategist Codex.

Zoku: Ein Tool, das wiederholte Workflows in Claude-Code automatisch erkennt
Zoku ist ein lokales Tool, das sich in das Ereignissystem von Claude Code einklinkt, um Tool-Aktionen über Sitzungen hinweg aufzuzeichnen, wiederkehrende Arbeitsablaufmuster zu identifizieren und Claude dann über diese Muster zu informieren, damit es sie proaktiv vorschlagen oder ausführen kann. Es erfordert keine Konfiguration, hat keine Abhängigkeiten und speichert alles lokal in ~/.zoku/.