Système de mémoire open-source pour agents LLM atteint des scores élevés aux benchmarks

Système de mémoire pour agents LLM avec benchmarks publiés
Un développeur a construit un système de mémoire persistante pour Claude Code et OpenClaw qui donne aux agents LLM une véritable continuité de contexte entre les sessions. Le système atteint des scores de benchmark de 90,8 % sur LoCoMo (surpassant tous les systèmes publiés) et 89,1 % sur LongMemEval.
Architecture et compatibilité avec les frameworks
L'architecture est basée sur des adaptateurs, actuellement connectée aux événements du cycle de vie, mais les composants principaux (stockage, récupération, intelligence) sont indépendants du framework. Le pipeline de récupération utilise une approche RRF à 4 canaux avec FTS5, Qdrant KNN, récence et parcours de graphe. La couche d'intelligence comprend la classification d'intention, les modèles d'expérience et les composants de politique RL qui pourraient s'intégrer à n'importe quel framework d'agent.
Configuration et pile technologique
La configuration rapide nécessite :
ollama pull snowflake-arctic-embed2
bun install && bun run build && bun run setup
node dist/angel/index.cjsLa pile technologique comprend TypeScript, SQLite (better-sqlite3), Qdrant, Ollama, esbuild et Vitest.
Décisions de conception clés
- Système d'écriture double avec SQLite comme source de vérité et Qdrant pour l'accélération, avec dégradation gracieuse
- Chaque opération est non-lancée — les échecs individuels ne cassent jamais le pipeline
- Crochets éphémères (durée de vie en millisecondes) pour la capture, Angel persistant pour la réflexion
- Les modèles de politique RL sont en TypeScript pur (mathématiques Float32Array, pas de PyTorch)
- Remplissage rétroactif des embeddings tenant compte de la longueur du contenu en arrière-plan
Le projet contient 29 000 lignes de code, 1 968 tests et est sous licence MIT à https://github.com/grigorijejakisic/Claudex.
📖 Read the full source: r/openclaw
👀 See Also

MLJAR Studio : Analyste de données IA local qui génère des notebooks reproductibles
MLJAR Studio est une application de bureau qui transforme les questions en langage naturel en notebooks Python exécutés localement, avec AutoML pour les données tabulaires et la prise en charge des LLM locaux via Ollama.

Le compilateur SMELT réduit l'utilisation des jetons d'espace de travail OpenClaw jusqu'à 95 %
SMELT compile les fichiers markdown de l'espace de travail OpenClaw en une forme d'exécution plus dense, envoyant uniquement le contenu pertinent aux modèles d'IA. Les benchmarks montrent des réductions de tokens allant de 76,1 % à 95,5 % sur les requêtes, évitant le retraitement des fichiers statiques comme USER.md et SOUR.md à chaque message.

Académie Claude : Un Bootcamp de Codage Gratuit Qui Fonctionne dans Claude Desktop
Un développeur a créé Claude Academy, un bootcamp de codage gratuit qui fonctionne entièrement dans l'onglet Code de Claude Desktop. Le système utilise trois commandes pour dispenser 64 leçons structurées couvrant les fondamentaux du développement web, avec suivi de progression et construction de projets réels.

ProofShot CLI offre aux agents d'IA de codage des capacités de vérification par navigateur.
ProofShot est un outil CLI open-source qui permet aux agents d'IA de codage de vérifier les fonctionnalités de l'interface utilisateur en enregistrant des sessions de navigation, en capturant des captures d'écran et en collectant les erreurs de la console. Il fonctionne avec tout agent capable d'exécuter des commandes shell et génère des rapports HTML autonomes pour examen humain.