Engram Memory SDK: Graph-basierte Speicherlösung für KI-Agenten mit lokalen Modellen

Graph Memory SDK für lokale KI-Modelle
Engram Memory SDK ist ein Open-Source-Graphgedächtnissystem für KI-Agenten, das mit lokalen Modellen über LiteLLM-Integration funktioniert. Die Kernarchitektur trennt Aufnahme von Abruf: Sie benötigen den LLM nur einmal während der Aufnahme, um Entitäten und Beziehungen zu extrahieren, während der Abruf über reine Vektorsuche, Graphendurchlauf und Bewertung ohne zusätzliche LLM-Aufrufe erfolgt.
Technische Details
Das SDK ist mit asynchronem Python gebaut und verwendet Neo4j als Backend-Datenbank. Laut Quelle beträgt es durchschnittlich ~735 Token pro Aufnahmevorgang und erreicht 95ms Abruflatenz. Das System umfasst selbstrestrukturierende Gedächtnisfunktionen mit Verfall und Clustering, die im Hintergrund laufen.
Einrichtung und Installation
Die Installation ist unkompliziert:
pip install engram-memory-sdkDie Konfiguration erfordert eine .env-Datei mit diesen Variablen:
LLM_MODEL=ollama/llama3 # oder jedes LiteLLM-unterstützte lokale Modell
NEO4J_URI=bolt://localhost:7687Das System unterstützt jedes Modell über LiteLLM, einschließlich lokaler Bereitstellungen über Ollama, vLLM und text-generation-webui. Der Hauptvorteil ist Kosteneffizienz: Mit einem kleinen lokalen Modell für die Extraktion haben laufende Abrufvorgänge buchstäblich $0 Kosten, da sie keine LLM-Token verbrauchen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

mnemos: Eine persistente Gedächtnisschicht für KI-Coding-Agenten (Go, MCP-nativ, kein Python)
mnemos ist eine Go-basierte, MCP-native Gedächtnisschicht für KI-Coding-Agenten. Der Autor entwickelte einen Verifizierer zur Messung der Verbesserung: +40% aggregiert bei Lese-Szenarien, aber nur 53% Erfassungsrate beim Schreiben nach iterativen Korrekturen.

Lean Context: Claude Code Plugin wandelt ausführliche Dokumente in agentenoptimierte Dateien um
Ein kostenloses, quelloffenes Claude Code-Plugin namens Lean Context durchsucht Projekt-Dokumentationen und entfernt Inhalte, die KI-Agenten durch Grepping entdecken können, behält dabei nur wesentliche, nicht offensichtliche Befehle, Fallstricke und Umgebungsbesonderheiten. In einem .NET-E-Commerce-Projekttest reduzierte es 8 Dokumente mit insgesamt 1.263 Zeilen auf nur 23 Zeilen.

CK Search: Lokales semantisches Suchtool mit MCP-Server-Integration
CK Search ist ein lokales semantisches Suchwerkzeug mit einem integrierten MCP-Server, das beliebige Textverzeichnisse ohne Cloud-Abhängigkeiten indiziert. Das Tool kann von KI-Agenten über MCP genutzt werden, und die Quelle bietet eine praktische Schritt-für-Schritt-Anleitung, die Einrichtung, Stärken und Grenzen im Vergleich zu grep abdeckt.

Reverse-Engineered Claude Code SDK in vier Sprachen veröffentlicht
Ein Entwickler hat Claude Code reverse-engineered und Single-File-SDKs in Node.js, Python, Go und Rust ohne Abhängigkeiten erstellt. Die Tools bieten einen vollständigen Agent-Loop mit Streaming und Tool-Nutzung unter Verwendung bestehender Claude Pro/Max-Abonnements.