agentmemory V4 atteint 96,2 % au benchmark LongMemEval, surpassant les systèmes de mémoire d'IA commerciaux.

✍️ OpenClawRadar📅 Publié: March 27, 2026🔗 Source

agentmemory V4 est un système de mémoire open source pour agents d'IA qui vient d'obtenir un score record mondial de 96,2 % sur LongMemEval, le benchmark standard pour la mémoire à long terme des agents d'IA.

Performance sur le benchmark

Le système a surpassé plusieurs entreprises d'IA à mémoire financées :

PwC Chronos : 95,6 %
Mastra : 94,87 %
OMEGA : 93,2 % (brut)
Supermemory : 85,86 %
Emergence AI : 86 %
Zep : 71,2 %

Détails du développement

Développé seul en 16 jours sur un PC gaming milieu de gamme (i3-12100F) avec un coût total de 1 000 $. Le système utilise Claude Opus comme générateur et GPT-4o comme juge, mais l'architecture de récupération est l'innovation principale.

Architecture technique

Le système combine plusieurs techniques de récupération dans un seul système basé sur SQLite :

HNSW (Hierarchical Navigable Small World) pour la recherche approximative des plus proches voisins
BM25 pour la récupération de texte traditionnelle
Cross-encoder pour le scoring de pertinence
Intégration de graphe de connaissances
Ancrage temporel pour la récupération de mémoire sensible au temps

Disponibilité

Le système est open source sous licence MIT et disponible à : github.com/JordanMcCann/agentmemory

📖 Read the full source: r/LocalLLaMA

👀 See Also

Tools

Quatre compétences de ClawHub pour les données de recherche en temps réel dans les agents IA

Quatre compétences ClawHub offrent des capacités de recherche structurée pour les agents IA : Google (web, actualités, images, cartes), Amazon (recherche de produits sur 12 marchés), Walmart (recherche de produits avec filtres de livraison) et YouTube (recherche vidéo avec transcriptions). Installation via les commandes clawhub install avec une seule clé API.

Apr 21, 2026, 06:30 AM UTC

OpenClawRadar

Tools

Trepan : Auditeur de sécurité local VS Code pour le code généré par l'IA

Trepan est une extension open-source pour VS Code qui agit comme un gardien de sécurité pour les suggestions de code générées par l'IA. Il utilise Ollama pour exécuter des audits de sécurité locaux contre des règles spécifiques au projet dans un fichier .trepan/system_rules.md.

Mar 21, 2026, 05:45 PM UTC

OpenClawRadar

Tools

Le moteur de RPG solo open-source utilise trois instances Claude pour l'analyse, la narration et la direction.

EdgeTales est un moteur de jeu de rôle solo open-source basé sur du texte où la mécanique des dés détermine les résultats et l'IA Claude génère une prose atmosphérique. Le système utilise trois instances Claude en pipeline : Cerveau (Haiku) pour analyser l'entrée en JSON, Narrateur (Sonnet) pour écrire la prose, et Directeur (Haiku) pour l'analyse asynchrone des scènes.

Mar 1, 2026, 04:45 PM UTC

OpenClawRadar

Tools

Validation du modèle d'aptitude à auto-évolution : résultats d'une expérience en 5 tours

Un développeur a testé le modèle de conception de compétence auto-évolutive pour Claude Code avec une expérience en 5 tours sur une base de données MySQL comprenant 29 tables et 590 Mo de données de gestion intelligente de bâtiments. Les principaux résultats incluent un taux de rejet à cinq portes de 63,6 %, une convergence incrémentielle et une précision de 100 % sans aucune connaissance incorrecte survivante.

Mar 8, 2026, 11:45 AM UTC

OpenClawRadar