agentmemory V4 erreicht 96,2 % auf dem LongMemEval-Benchmark und übertrifft damit kommerzielle KI-Gedächtnissysteme.

✍️ OpenClawRadar📅 Veröffentlicht: 27. März 2026🔗 Source
agentmemory V4 erreicht 96,2 % auf dem LongMemEval-Benchmark und übertrifft damit kommerzielle KI-Gedächtnissysteme.
Ad

agentmemory V4 ist ein Open-Source-Speichersystem für KI-Agenten, das gerade einen Weltrekordwert von 96,2 % auf LongMemEval erzielt hat, dem Standard-Benchmark für das Langzeitgedächtnis von KI-Agenten.

Benchmark-Leistung

Das System übertraf mehrere geförderte KI-Speicherunternehmen:

  • PwC Chronos: 95,6 %
  • Mastra: 94,87 %
  • OMEGA: 93,2 % (roh)
  • Supermemory: 85,86 %
  • Emergence AI: 86 %
  • Zep: 71,2 %

Entwicklungsdetails

Allein in 16 Tagen auf einem Mittelklasse-Gaming-PC (i3-12100F) mit Gesamtkosten von 1.000 US-Dollar entwickelt. Das System nutzt Claude Opus als Generator und GPT-4o als Bewerter, aber die Abrufarchitektur ist die Kerninnovation.

Ad

Technische Architektur

Das System kombiniert mehrere Abruftechniken in einem einzigen SQLite-basierten System:

  • HNSW (Hierarchical Navigable Small World) für die approximative Suche nach nächsten Nachbarn
  • BM25 für traditionelle Textabfrage
  • Cross-Encoder für Relevanzbewertung
  • Integration von Wissensgraphen
  • Zeitliche Verankerung für zeitbewusste Speicherabrufe

Verfügbarkeit

Das System ist Open Source unter der MIT-Lizenz und verfügbar unter: github.com/JordanMcCann/agentmemory

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM
Werkzeuge

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM

ToolLoop ist ein Open-Source-Python-Framework mit 11 Tools für Dateioperationen, Codesuche, Shell-Zugriff und Sub-Agenten, das über LiteLLM mit jedem LLM funktioniert. Das 2.700-Zeilen-Framework ermöglicht den Wechsel von Modellen während einer Konversation bei gleichbleibendem gemeinsamen Kontext.

OpenClawRadar
Claude Code unterstützt jetzt über 240 Modelle über das NVIDIA NIM Gateway – darunter Nemotron-3 120B für agentisches Programmieren
Werkzeuge

Claude Code unterstützt jetzt über 240 Modelle über das NVIDIA NIM Gateway – darunter Nemotron-3 120B für agentisches Programmieren

Claude Code kann während einer Sitzung über den Befehl /model auf über 240 NVIDIA NIM Modelle umschalten. Die Denkvariante von Nemotron-3 Super 120B zeigt starke Ergebnisse bei der Umstrukturierung mehrerer Dateien und agentischen Aufgaben.

OpenClawRadar
ReasonDB: Open-Source-Dokumentendatenbank mit LLM-gesteuerter Baumnavigation anstelle von Vektorsuche
Werkzeuge

ReasonDB: Open-Source-Dokumentendatenbank mit LLM-gesteuerter Baumnavigation anstelle von Vektorsuche

ReasonDB ist eine Open-Source-Dokumentendatenbank, die die Dokumentenstruktur als Hierarchie erhält und anstelle der Vektorsuche LLM-gesteuerte Baumtraversierung für die Abfrage verwendet. Sie nutzt BM25 für die anfängliche Suche, tree-grep für die Strukturfilterung und Beam-Search-Traversierung, bei der das LLM etwa 25 Knoten von Millionen besucht.

OpenClawRadar
Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.
Werkzeuge

Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.

Für 10 US-Dollar pro Monat bietet Alibabas Plan Zugang zu den Modellen Qwen3.5-Plus, Kimi-K2.5, GLM-5 und MiniMax-M2.5 mit Kontingenten von 1.200 Anfragen pro 5 Stunden, 9.000 pro Woche und 18.000 pro Monat.

OpenClawRadar