agentmemory V4 erreicht 96,2 % auf dem LongMemEval-Benchmark und übertrifft damit kommerzielle KI-Gedächtnissysteme.

agentmemory V4 ist ein Open-Source-Speichersystem für KI-Agenten, das gerade einen Weltrekordwert von 96,2 % auf LongMemEval erzielt hat, dem Standard-Benchmark für das Langzeitgedächtnis von KI-Agenten.
Benchmark-Leistung
Das System übertraf mehrere geförderte KI-Speicherunternehmen:
- PwC Chronos: 95,6 %
- Mastra: 94,87 %
- OMEGA: 93,2 % (roh)
- Supermemory: 85,86 %
- Emergence AI: 86 %
- Zep: 71,2 %
Entwicklungsdetails
Allein in 16 Tagen auf einem Mittelklasse-Gaming-PC (i3-12100F) mit Gesamtkosten von 1.000 US-Dollar entwickelt. Das System nutzt Claude Opus als Generator und GPT-4o als Bewerter, aber die Abrufarchitektur ist die Kerninnovation.
Technische Architektur
Das System kombiniert mehrere Abruftechniken in einem einzigen SQLite-basierten System:
- HNSW (Hierarchical Navigable Small World) für die approximative Suche nach nächsten Nachbarn
- BM25 für traditionelle Textabfrage
- Cross-Encoder für Relevanzbewertung
- Integration von Wissensgraphen
- Zeitliche Verankerung für zeitbewusste Speicherabrufe
Verfügbarkeit
Das System ist Open Source unter der MIT-Lizenz und verfügbar unter: github.com/JordanMcCann/agentmemory
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM
ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen während einer Konversation bei gleichbleibendem gemeinsamen Kontext.

Claude Code unterstützt jetzt über 240 Modelle über das NVIDIA NIM Gateway – darunter Nemotron-3 120B für agentisches Programmieren
Claude Code kann während einer Sitzung über den Befehl /model auf über 240 NVIDIA NIM Modelle umschalten. Die Denkvariante von Nemotron-3 Super 120B zeigt starke Ergebnisse bei der Umstrukturierung mehrerer Dateien und agentischen Aufgaben.

ReasonDB: Open-Source-Dokumentendatenbank mit LLM-gesteuerter Baumnavigation anstelle von Vektorsuche
ReasonDB ist eine Open-Source-Dokumentendatenbank, die die Dokumentenstruktur als Hierarchie erhält und anstelle der Vektorsuche LLM-gesteuerte Baumtraversierung für die Abfrage verwendet. Sie nutzt BM25 für die anfängliche Suche, tree-grep für die Strukturfilterung und Beam-Search-Traversierung, bei der das LLM etwa 25 Knoten von Millionen besucht.

Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.
Für 10 US-Dollar pro Monat bietet Alibabas Plan Zugang zu den Modellen Qwen3.5-Plus, Kimi-K2.5, GLM-5 und MiniMax-M2.5 mit Kontingenten von 1.200 Anfragen pro 5 Stunden, 9.000 pro Woche und 18.000 pro Monat.