Lokales MCP-Speichersystem mit Konsolidierung für KI-Gespräche

✍️ OpenClawRadar📅 Veröffentlicht: 26. Februar 2026🔗 Source
Lokales MCP-Speichersystem mit Konsolidierung für KI-Gespräche
Ad

Was das ist

Ein Entwickler hat ein lokales Speichersystem für KI-Gespräche geschaffen, das Informationen konsolidiert und synthetisiert, anstatt sie nur zu speichern. Als MCP-Server aufgebaut, funktioniert es mit kompatiblen Clients wie Claude Desktop und Claude Code und läuft zu 100 % lokal, ohne dass Daten Ihre Hardware verlassen.

Wie es funktioniert

Der entscheidende Unterschied zu herkömmlichen RAG-Systemen ist der Konsolidierungsprozess. Alle 6 Stunden gruppiert eine lokale LLM (Qwen 2.5-7B, die in LM Studio läuft) aktuelle Erinnerungen nach Themen und fasst sie zu strukturierten Wissensdokumenten zusammen. Sie extrahiert Fakten, Lösungen und Präferenzen, vereint sie mit bestehendem Wissen und versioniert alles.

Technischer Stack

  • Embeddings: nomic-embed-text-v1.5 über LM Studio
  • Vektorsuche: FAISS (semantisch + Keyword-Hybrid)
  • Konsolidierungs-LLM: Qwen 2.5-7B (Q4) über LM Studio
  • Speicher: SQLite für Episoden, FAISS für Vektoren
  • Protokoll: MCP – funktioniert mit allem, was es unterstützt
  • Konfiguration: TOML

Funktionen

  • Semantische Deduplizierung mit Kosinus-Ähnlichkeitsschwelle von 0,95
  • Adaptives Überraschungs-Scoring – häufig genutzte Erinnerungen werden verstärkt, veraltete verblassen
  • Atomare Schreibvorgänge mit tempfile + os.replace für Absturzschutz
  • Tombstone-basierte FAISS-Löschung – O(1) anstatt den gesamten Index neu aufzubauen
  • Graceful Degradation – wenn LM Studio ausfällt, funktioniert die Speicherung weiter, Konsolidierung pausiert
  • 88 Tests bestanden
Ad

MCP-Tools

  • memory_store – speichere eine Episode mit Typ, Tags, Überraschungs-Score
  • memory_recall – semantische Suche über Episoden + konsolidiertes Wissen
  • memory_forget – markiere eine Episode zur Entfernung
  • memory_correct – aktualisiere ein Wissensdokument
  • memory_export – vollständiges JSON-Backup
  • memory_status – Systemstatusprüfung

Warum MCP gewählt wurde

Modelle werden häufig ersetzt, aber angesammeltes Wissen sollte nicht mit ihnen verschwinden. MCP macht den Speicher portabel – ein Speicher, viele Schnittstellen. Die Speicherschicht wird wertvoller als jedes einzelne Modell.

Praktische Ergebnisse

Nach etwa einer Woche Nutzung hat das System Wissensdokumente über PC-Hardware, VR-Einrichtung, Programmierpräferenzen und Projektarchitekturen aufgebaut – alles aus normalen Gesprächen synthetisiert. Wenn neue Chats beginnen, kennt die KI bereits den Kontext des Nutzers, ohne dass er ihn neu erklären muss.

Anforderungen

  • Python 3.11+
  • LM Studio mit geladenem Qwen 2.5-7B und nomic-embed-text-v1.5
  • Beliebiger MCP-Client

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

EvalShift: Open-Source-CLI zur Erkennung von LLM-Regressionen bei der Modellmigration
Werkzeuge

EvalShift: Open-Source-CLI zur Erkennung von LLM-Regressionen bei der Modellmigration

EvalShift ist ein MIT-lizenziertes Python-CLI, das Ausgaben von Quell- vs. Ziel-LLMs über Prompts, Agents und Tool-Calling-Workflows vergleicht und einen lokalen HTML-Regressionsbericht erstellt.

OpenClawRadar
Übersetze zu de: AGENTS.md Schema für LLM-kompilierte Wissensbasen mit Lernschicht
Werkzeuge

Übersetze zu de: AGENTS.md Schema für LLM-kompilierte Wissensbasen mit Lernschicht

AGENTS.md v1.0 bietet einen Schema-Standard für Claude, um persönliche Forschungs-Wikis aus Rohquellen zu erstellen und zu pflegen, einschließlich einer Schicht für verteiltes Wiederholungslernen mit automatischer Erstellung von Lernkarten und Nachverfolgung von Wissenslücken.

OpenClawRadar
Multi-LLM Papier-Trading-Bot mit Claude Opus als leitendem Ingenieur und Gemini als Stratege: Architekturaufschlüsselung
Werkzeuge

Multi-LLM Papier-Trading-Bot mit Claude Opus als leitendem Ingenieur und Gemini als Stratege: Architekturaufschlüsselung

Ein Solo-Entwickler teilt einen 4.900-Zeilen Paper-Trading-Bot auf Alpaca, bei dem Claude Opus 4 (Engineer) ein Vetorecht gegenüber Gemini Pro (Strategist) hat, samt eines Protokolls mit über 270 Einträgen, dem sogenannten Strategist Codex.

OpenClawRadar
Zoku: Ein Tool, das wiederholte Workflows in Claude-Code automatisch erkennt
Werkzeuge

Zoku: Ein Tool, das wiederholte Workflows in Claude-Code automatisch erkennt

Zoku ist ein lokales Tool, das sich in das Ereignissystem von Claude Code einklinkt, um Tool-Aktionen über Sitzungen hinweg aufzuzeichnen, wiederkehrende Arbeitsablaufmuster zu identifizieren und Claude dann über diese Muster zu informieren, damit es sie proaktiv vorschlagen oder ausführen kann. Es erfordert keine Konfiguration, hat keine Abhängigkeiten und speichert alles lokal in ~/.zoku/.

OpenClawRadar