agentmemory V4 erreicht 96,2 % auf dem LongMemEval-Benchmark und übertrifft damit kommerzielle KI-Gedächtnissysteme.

✍️ OpenClawRadar📅 Veröffentlicht: 27. März 2026🔗 Source

agentmemory V4 ist ein Open-Source-Speichersystem für KI-Agenten, das gerade einen Weltrekordwert von 96,2 % auf LongMemEval erzielt hat, dem Standard-Benchmark für das Langzeitgedächtnis von KI-Agenten.

Benchmark-Leistung

Das System übertraf mehrere geförderte KI-Speicherunternehmen:

PwC Chronos: 95,6 %
Mastra: 94,87 %
OMEGA: 93,2 % (roh)
Supermemory: 85,86 %
Emergence AI: 86 %
Zep: 71,2 %

Entwicklungsdetails

Allein in 16 Tagen auf einem Mittelklasse-Gaming-PC (i3-12100F) mit Gesamtkosten von 1.000 US-Dollar entwickelt. Das System nutzt Claude Opus als Generator und GPT-4o als Bewerter, aber die Abrufarchitektur ist die Kerninnovation.

Technische Architektur

Das System kombiniert mehrere Abruftechniken in einem einzigen SQLite-basierten System:

HNSW (Hierarchical Navigable Small World) für die approximative Suche nach nächsten Nachbarn
BM25 für traditionelle Textabfrage
Cross-Encoder für Relevanzbewertung
Integration von Wissensgraphen
Zeitliche Verankerung für zeitbewusste Speicherabrufe

Verfügbarkeit

Das System ist Open Source unter der MIT-Lizenz und verfügbar unter: github.com/JordanMcCann/agentmemory

📖 Read the full source: r/LocalLLaMA

👀 Siehe auch

Werkzeuge

re_gent: Git für KI-Codierungsagenten – Versionskontrolle für Agentenaktivitäten

re_gent ist ein Open-Source-Tool, das Versionskontrolle für KI-Agenten-Sitzungen bietet, jeden Tool-Aufruf verfolgt, Eingabeaufforderungen und Datei-Diffs speichert und Befehle wie `rgt log`, `rgt blame` und `rgt rewind` (demnächst verfügbar) ermöglicht.

8. Mai 2026, 18:15 UTC

OpenClawRadar

Werkzeuge

Wie KI-Assistenten Webseiten abrufen: Nginx-Loganalyse von ChatGPT, Claude, Gemini und anderen

Ein Entwickler testete fünf große KI-Assistenten, indem er sie mit eindeutigen URLs ansprach und Nginx-Logs überwachte, wodurch unterschiedliche Abrufmuster aufgedeckt wurden: ChatGPT, Claude und Perplexity verwenden dedizierte User-Agents, während Gemini aus seinem Index antwortete, ohne eine Abfrage durchzuführen.

20. Apr. 2026, 18:42 UTC

OpenClawRadar

Werkzeuge

Handoffs-Muster in Claude-Workflows: Zwei-Datei-Aufteilung vs. Ein-Dokument-Zusammenfassung

Lange Claude-Sitzungen leiden unter Kontextverfall. Handoffs komprimieren das Wesentliche und starten neu. Zwei Ansätze: Matt Pococks Single-Dokument-Handoff-Skill vs. eine Zwei-Datei-Aufteilung mit persistentem Narrativ und ephemerem Prompt.

1. Juni 2026, 00:18 UTC

OpenClawRadar

Werkzeuge

audio-analyzer-rs: Ein MCP-Server zur Audioanalyse mit Claude

Ein Entwickler hat audio-analyzer-rs erstellt, einen MCP-Server in Rust, der Claude direkten Zugriff auf Audioanalyse ermöglicht, einschließlich Spektral-, Harmonik-, Rhythmus-, LUFS-Lautstärke- (EBU R128) und Dynamikbereichsmessungen. Das Tool ist token-effizient, wobei Claude mit niedriger Auflösung beginnt und bei Bedarf auf kleine Ausschnitte zoomt.

12. März 2026, 17:45 UTC

OpenClawRadar