Engram Memory SDK: Graph-basierte Speicherlösung für KI-Agenten mit lokalen Modellen

✍️ OpenClawRadar📅 Veröffentlicht: 14. April 2026🔗 Source
Engram Memory SDK: Graph-basierte Speicherlösung für KI-Agenten mit lokalen Modellen
Ad

Graph Memory SDK für lokale KI-Modelle

Engram Memory SDK ist ein Open-Source-Graphgedächtnissystem für KI-Agenten, das mit lokalen Modellen über LiteLLM-Integration funktioniert. Die Kernarchitektur trennt Aufnahme von Abruf: Sie benötigen den LLM nur einmal während der Aufnahme, um Entitäten und Beziehungen zu extrahieren, während der Abruf über reine Vektorsuche, Graphendurchlauf und Bewertung ohne zusätzliche LLM-Aufrufe erfolgt.

Technische Details

Das SDK ist mit asynchronem Python gebaut und verwendet Neo4j als Backend-Datenbank. Laut Quelle beträgt es durchschnittlich ~735 Token pro Aufnahmevorgang und erreicht 95ms Abruflatenz. Das System umfasst selbstrestrukturierende Gedächtnisfunktionen mit Verfall und Clustering, die im Hintergrund laufen.

Ad

Einrichtung und Installation

Die Installation ist unkompliziert:

pip install engram-memory-sdk

Die Konfiguration erfordert eine .env-Datei mit diesen Variablen:

LLM_MODEL=ollama/llama3 # oder jedes LiteLLM-unterstützte lokale Modell
NEO4J_URI=bolt://localhost:7687

Das System unterstützt jedes Modell über LiteLLM, einschließlich lokaler Bereitstellungen über Ollama, vLLM und text-generation-webui. Der Hauptvorteil ist Kosteneffizienz: Mit einem kleinen lokalen Modell für die Extraktion haben laufende Abrufvorgänge buchstäblich $0 Kosten, da sie keine LLM-Token verbrauchen.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

mnemos: Eine persistente Gedächtnisschicht für KI-Coding-Agenten (Go, MCP-nativ, kein Python)
Werkzeuge

mnemos: Eine persistente Gedächtnisschicht für KI-Coding-Agenten (Go, MCP-nativ, kein Python)

mnemos ist eine Go-basierte, MCP-native Gedächtnisschicht für KI-Coding-Agenten. Der Autor entwickelte einen Verifizierer zur Messung der Verbesserung: +40% aggregiert bei Lese-Szenarien, aber nur 53% Erfassungsrate beim Schreiben nach iterativen Korrekturen.

OpenClawRadar
Lean Context: Claude Code Plugin wandelt ausführliche Dokumente in agentenoptimierte Dateien um
Werkzeuge

Lean Context: Claude Code Plugin wandelt ausführliche Dokumente in agentenoptimierte Dateien um

Ein kostenloses, quelloffenes Claude Code-Plugin namens Lean Context durchsucht Projekt-Dokumentationen und entfernt Inhalte, die KI-Agenten durch Grepping entdecken können, behält dabei nur wesentliche, nicht offensichtliche Befehle, Fallstricke und Umgebungsbesonderheiten. In einem .NET-E-Commerce-Projekttest reduzierte es 8 Dokumente mit insgesamt 1.263 Zeilen auf nur 23 Zeilen.

OpenClawRadar
CK Search: Lokales semantisches Suchtool mit MCP-Server-Integration
Werkzeuge

CK Search: Lokales semantisches Suchtool mit MCP-Server-Integration

CK Search ist ein lokales semantisches Suchwerkzeug mit einem integrierten MCP-Server, das beliebige Textverzeichnisse ohne Cloud-Abhängigkeiten indiziert. Das Tool kann von KI-Agenten über MCP genutzt werden, und die Quelle bietet eine praktische Schritt-für-Schritt-Anleitung, die Einrichtung, Stärken und Grenzen im Vergleich zu grep abdeckt.

OpenClawRadar
Reverse-Engineered Claude Code SDK in vier Sprachen veröffentlicht
Werkzeuge

Reverse-Engineered Claude Code SDK in vier Sprachen veröffentlicht

Ein Entwickler hat Claude Code reverse-engineered und Single-File-SDKs in Node.js, Python, Go und Rust ohne Abhängigkeiten erstellt. Die Tools bieten einen vollständigen Agent-Loop mit Streaming und Tool-Nutzung unter Verwendung bestehender Claude Pro/Max-Abonnements.

OpenClawRadar