agentmemory V4 atteint 96,2 % au benchmark LongMemEval, surpassant les systèmes de mémoire d'IA commerciaux.

✍️ OpenClawRadar📅 Publié: March 27, 2026🔗 Source
agentmemory V4 atteint 96,2 % au benchmark LongMemEval, surpassant les systèmes de mémoire d'IA commerciaux.
Ad

agentmemory V4 est un système de mémoire open source pour agents d'IA qui vient d'obtenir un score record mondial de 96,2 % sur LongMemEval, le benchmark standard pour la mémoire à long terme des agents d'IA.

Performance sur le benchmark

Le système a surpassé plusieurs entreprises d'IA à mémoire financées :

  • PwC Chronos : 95,6 %
  • Mastra : 94,87 %
  • OMEGA : 93,2 % (brut)
  • Supermemory : 85,86 %
  • Emergence AI : 86 %
  • Zep : 71,2 %

Détails du développement

Développé seul en 16 jours sur un PC gaming milieu de gamme (i3-12100F) avec un coût total de 1 000 $. Le système utilise Claude Opus comme générateur et GPT-4o comme juge, mais l'architecture de récupération est l'innovation principale.

Ad

Architecture technique

Le système combine plusieurs techniques de récupération dans un seul système basé sur SQLite :

  • HNSW (Hierarchical Navigable Small World) pour la recherche approximative des plus proches voisins
  • BM25 pour la récupération de texte traditionnelle
  • Cross-encoder pour le scoring de pertinence
  • Intégration de graphe de connaissances
  • Ancrage temporel pour la récupération de mémoire sensible au temps

Disponibilité

Le système est open source sous licence MIT et disponible à : github.com/JordanMcCann/agentmemory

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Le fichier de protocole Claude Code réduit les questions répétitives.
Tools

Le fichier de protocole Claude Code réduit les questions répétitives.

Un développeur a créé un fichier .md unique pour ~/.claude/rules/ qui déduit le type de tâche et le risque à partir du premier message, éliminant la séquence typique de trois questions de Claude Code avant de commencer le travail.

OpenClawRadar
Le pipeline MCP à appel unique réduit l'utilisation des tokens de Claude Code de 74 %.
Tools

Le pipeline MCP à appel unique réduit l'utilisation des tokens de Claude Code de 74 %.

Un développeur a créé un serveur MCP de moteur contextuel qui fournit à Claude Code un graphe de dépendances des bases de code, réduisant l'utilisation de tokens de 65 % initialement. Un nouveau pipeline en un seul appel réduit encore les tokens de 74 % en éliminant les allers-retours multiples et en dédupliquant les résultats côté serveur.

OpenClawRadar
🦀
Tools

Agentalmanac : Un catalogue de 23 serveurs MCP avec configurations JSON prêtes à coller

Un utilisateur de Reddit répertorie 23 serveurs MCP avec des configurations prêtes à coller pour Claude Desktop, Cursor et Continue. Il contourne les serveurs archivés pour proposer des alternatives maintenues. La démo hébergée fonctionne sur Cloudflare Workers.

OpenClawRadar
log-context-mcp : L'outil MCP réduit de 96% l'utilisation des tokens de journal pour le débogage de Claude
Tools

log-context-mcp : L'outil MCP réduit de 96% l'utilisation des tokens de journal pour le débogage de Claude

log-context-mcp est un outil MCP qui prétraite les fichiers journaux avant qu'ils n'atteignent le contexte de Claude, en dédupliquant les lignes, en regroupant les traces de pile et en éliminant le bruit pour réduire l'utilisation de tokens. Des tests sur un journal Apache de 2000 lignes ont montré une réduction de 96,5 % tout en identifiant correctement les causes racines.

OpenClawRadar