Système mémoire open-source LLM: 90,8 % LoCoMo

Système de mémoire pour agents LLM avec benchmarks publiés

Un développeur a construit un système de mémoire persistante pour Claude Code et OpenClaw qui donne aux agents LLM une véritable continuité de contexte entre les sessions. Le système atteint des scores de benchmark de 90,8 % sur LoCoMo (surpassant tous les systèmes publiés) et 89,1 % sur LongMemEval.

Architecture et compatibilité avec les frameworks

L'architecture est basée sur des adaptateurs, actuellement connectée aux événements du cycle de vie, mais les composants principaux (stockage, récupération, intelligence) sont indépendants du framework. Le pipeline de récupération utilise une approche RRF à 4 canaux avec FTS5, Qdrant KNN, récence et parcours de graphe. La couche d'intelligence comprend la classification d'intention, les modèles d'expérience et les composants de politique RL qui pourraient s'intégrer à n'importe quel framework d'agent.

Configuration et pile technologique

La configuration rapide nécessite :

ollama pull snowflake-arctic-embed2
bun install && bun run build && bun run setup
node dist/angel/index.cjs

La pile technologique comprend TypeScript, SQLite (better-sqlite3), Qdrant, Ollama, esbuild et Vitest.

Décisions de conception clés

Système d'écriture double avec SQLite comme source de vérité et Qdrant pour l'accélération, avec dégradation gracieuse
Chaque opération est non-lancée — les échecs individuels ne cassent jamais le pipeline
Crochets éphémères (durée de vie en millisecondes) pour la capture, Angel persistant pour la réflexion
Les modèles de politique RL sont en TypeScript pur (mathématiques Float32Array, pas de PyTorch)
Remplissage rétroactif des embeddings tenant compte de la longueur du contenu en arrière-plan

Le projet contient 29 000 lignes de code, 1 968 tests et est sous licence MIT à https://github.com/grigorijejakisic/Claudex.

📖 Read the full source: r/openclaw