Open-Source-MCP-Speicherserver mit Wissensgraphen und Lernfunktionen

Ein Open-Source-MCP-Server namens cuba-memorys bietet persistenten Speicher für KI-Agenten und geht über einfache RAG- oder Vektorspeicher hinaus. Geschrieben in Rust mit einem PostgreSQL + pgvector-Backend implementiert er eine Wissensgraphen-Architektur mit Lernfähigkeiten.
Architektur und Funktionen
Das System speichert Entitäten, Beobachtungen und typisierte Beziehungen statt flacher Dokumente. Wichtige Funktionen umfassen:
- Exponentieller Zerfall — Erinnerungen verblassen realistisch mittels Wichtigkeit = Wichtigkeit * exp(-0,693 * Tage/Halbwertszeit) mit einer 30-Tage-Halbwertszeit
- Hebb'sche + BCM-Metaplastizität — Ojas Regel mit EMA-Gleitwert-Schwelle; Erinnerungen verstärken sich durch Zugriff und normalisieren sich selbst via BCM
- 4-Signal-RRF-Fusion (k=60) — Kombiniert ts_rank + Trigramme + pgvector HNSW + Wichtigkeit mit entropiegesteuerter Gewichtung, um schlüsselwortdominante vs. semantische Abfragen zu erkennen
- Leiden-Community-Erkennung — Traag et al. 2019 Algorithmus zur Entdeckung von Clustern im Wissensgraphen
- Personalisierter PageRank — Bewertet Entitätswichtigkeit basierend auf Graphentopologie
- Anti-Halluzinations-Verifizierung — Trianguliert Behauptungen gegen gespeichertes Wissen mit abgestufter Konfidenzbewertung
- Fehlerspeicher mit Mustererkennung — Löst Warnungen aus, wenn ≥3 ähnliche Fehler auftreten
Leistungsbenchmarks
Die Rust-Implementierung zeigt deutliche Verbesserungen gegenüber der ursprünglichen Python-Version:
- Binärgröße: ~50MB venv (Python) vs 7,6MB (Rust)
- Entität erstellen: ~2ms (Python) vs 498μs (Rust)
- Hybridsuche: <5ms (Python) vs 2,52ms (Rust)
- Speichernutzung: ~120MB (Python) vs ~15MB (Rust)
- Abhängigkeiten: 12 Pakete (Python) vs 0 Laufzeit (Rust)
Implementierungsdetails
Der Server bietet 13 MCP-Tools und funktioniert mit jedem MCP-kompatiblen Client, einschließlich Claude Code, Cursor und Windsurf. Er ist selbst gehostet mit einem PostgreSQL-Backend und macht keine externen API-Aufrufe. Alle Algorithmen basieren auf peer-reviewed Papern mit Zitaten im README.
Installationsoptionen:
pip install cuba-memorys
oder
npm install -g cuba-memorys
Das Projekt ist unter CC BY-NC 4.0 Lizenz auf GitHub verfügbar.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

P2PCLAW: Ein Peer-to-Peer-Netzwerk für KI-Agenten zur Veröffentlichung formal verifizierter Wissenschaft
P2PCLAW ist ein Peer-to-Peer-Netzwerk, in dem KI-Agenten und menschliche Forscher wissenschaftliche Ergebnisse veröffentlichen können, die durch formale mathematische Beweise in Lean 4 validiert wurden. Das System nutzt GUN.js und IPFS mit Post-Quanten-Kryptografie und Datenschutzfunktionen für eine sichere Teilnahme.

Open-Source-Jobsuch-Framework, erstellt in Claude Code
Ein Entwickler, der entlassen wurde, hat ein Open-Source-Jobsuch-Framework in Claude Code erstellt, um den gesamten Jobsuch-Workflow zu bewältigen. Anstatt manuell Bewerbungen zu verschicken, automatisiert das System Schlüsselbereiche des Prozesses, während menschliche Kontrolle erhalten bleibt.

SimplePDF Copilot: Clientseitiger KI-Aufruf zum Ausfüllen von PDF-Formularen
SimplePDF Copilot nutzt clientseitiges Tool Calling, damit ein LLM Felder ausfüllen, Felder hinzufügen, Seiten löschen und mehr in PDFs tun kann – ohne dass das PDF den Browser verlässt.

Der Engpass bei parallelen KI-Agenten: Warteschlange für menschliche Genehmigung
Ein Entwickler, der parallele Claude Code Agents betreibt, beschreibt den 'Bottleself' – den Punkt, an dem Parallelität keine zusätzliche Ausgabe mehr erzeugt, sondern einen Rückstau an menschlichen Freigaben verursacht. Seine Lösung: ein Planer, der Ziele in Teilaufgaben zerlegt, Agents startet und nur bei ungelösten Entscheidungen nachfragt.