LightMem: Leichtgewichtiges Speichersystem für LLM-Agenten mit 10-fachen+ Leistungsgewinnen und 100-fach geringeren Kosten

✍️ OpenClawRadar📅 Veröffentlicht: 26. Februar 2026🔗 Source
LightMem: Leichtgewichtiges Speichersystem für LLM-Agenten mit 10-fachen+ Leistungsgewinnen und 100-fach geringeren Kosten
Ad

LightMem: Eine praktische Speicherschicht für LLM-Agenten

LightMem ist ein leichtgewichtiges, modulares Speichersystem für LLM-Agenten, das die Herausforderungen langer, mehrstufiger Interaktionen angeht, bei denen der Kontext unübersichtlich und kostspielig wird, Modelle sich "in der Mitte verlieren" und bestehende Speichersysteme Latenz und Token-Kosten erhöhen.

Wie LightMem funktioniert

Das System erhält kompakte, themenbezogene und konsistente Erinnerungen durch drei Schlüsselmechanismen:

  • Vorverarbeitung des sensorischen Gedächtnisses: Filtert redundante und wenig wertvolle Token vor der Speicherung
  • Themenbewusstes Kurzzeitgedächtnis: Gruppiert Interaktionen nach Themen und fasst sie zu präzisen Speichereinheiten zusammen
  • Langzeitkonsolidierung in Ruhephasen: Nutzt inkrementelle Einfügungen während der Laufzeit sowie Offline-Aktualisierungen in hoher Qualität ohne Latenzauswirkungen

Leistungsergebnisse

Im LongMemEval-Benchmark zeigt LightMem:

  • Genauigkeitsverbesserung: bis zu ~10,9 %
  • Token-Reduktion: bis zum 117-fachen
  • API-Aufruf-Reduktion: bis zum 159-fachen
  • Laufzeit-Reduktion: >12-fach
Ad

Aktuelle Updates und Funktionen

  • Baseline-Bewertungsrahmen für verschiedene Speichersysteme (Mem0, A-MEM, LangMem) auf LoCoMo & LongMemEval
  • Demo-Video und Tutorial-Notebooks für mehrere Szenarien
  • MCP-Server-Integration für mehrfache Speicheraufrufe
  • Vollständige LoCoMo-Datensatzunterstützung
  • GLM-4.6-Integration mit reproduzierbaren Skripten
  • Lokale Bereitstellung über Ollama, vLLM, Transformers mit automatischer Ladekapazität

Positionierung und Anwendungsfälle

LightMem ist als modulare Speicherschicht konzipiert, die sich in verschiedene Agenten-Stacks integrieren lässt, einschließlich:

  • Langzeitkontext-Agenten
  • Werkzeugnutzende Agenten
  • Autonome Workflows
  • Konversationssysteme

Das System bietet strukturierten Speicher, der skaliert, ohne die Token-Anzahl explodieren zu lassen, was es besonders nützlich für Entwickler macht, die mit Agenten-Frameworks, Speicher-/RAG-Systemen, Langzeitkontext-Modellen und angewandten LLM-Teams arbeiten.

Verfügbarkeit

Paper: https://arxiv.org/abs/2510.18866

Code: https://github.com/zjunlp/LightMem

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Pretticlaw: Eine leichtere Alternative zu OpenClaw mit schnellerer Einrichtung
Werkzeuge

Pretticlaw: Eine leichtere Alternative zu OpenClaw mit schnellerer Einrichtung

Pretticlaw ist eine leichte Alternative zu OpenClaw, die nur 2 Befehle für die Einrichtung benötigt, einen Speicherbedarf von 30 MB hat, in 2-3 Sekunden antwortet und ein integriertes Dashboard auf Port 6767 bietet.

OpenClawRadar
Die Dual-Modell-Architektur reduziert den Token-Verbrauch für lange Gespräche um die Hälfte.
Werkzeuge

Die Dual-Modell-Architektur reduziert den Token-Verbrauch für lange Gespräche um die Hälfte.

Ein Entwickler hat ein Dual-Modell-System aufgebaut, bei dem ein kleines 'Unterbewusstseins'-Modell im Hintergrund den Gesprächsverlauf komprimiert. Dadurch kann das Hauptmodell mit einem kuratierten Kontext von etwa 35K Token arbeiten, anstatt mit 120K Token des rohen Verlaufs. Diese Architektur reduziert den Token-Verbrauch bei längerfristigen Projektarbeiten ungefähr um die Hälfte.

OpenClawRadar
Windows-System-Tray-Monitor für Claude-Code-Kontingent
Werkzeuge

Windows-System-Tray-Monitor für Claude-Code-Kontingent

Eine Windows-Systemtray-Anwendung, die die Claude Code-Nutzung mit einem farbcodierten Symbol überwacht, Kontingentdaten alle 5 Minuten über die Anthropic OAuth API automatisch aktualisiert und detaillierte Dashboards mit stündlichen, täglichen, wöchentlichen und monatlichen Nutzungsmustern bereitstellt.

OpenClawRadar
OpenSwarm: Multi-Agent Claude CLI Orchestrator für Linear und GitHub
Werkzeuge

OpenSwarm: Multi-Agent Claude CLI Orchestrator für Linear und GitHub

OpenSwarm orchestriert mehrere Claude Code CLI-Instanzen als autonome Agenten, die Linear-Issues abrufen und Worker/Reviewer/Test/Documenter-Pipelines ausführen. Es verwendet LanceDB mit mehrsprachigen e5-Embeddings für das Gedächtnis und umfasst Discord-Bot-Steuerung, automatische PR-Verbesserung und ein Web-Dashboard.

OpenClawRadar