AgentWorkingMemory : Un système de mémoire local pour les agents d'IA de codage

✍️ OpenClawRadar📅 Publié: March 25, 2026🔗 Source
AgentWorkingMemory : Un système de mémoire local pour les agents d'IA de codage
Ad

Ce que résout AgentWorkingMemory

Les agents d'IA de codage comme Claude Code manquent de mémoire persistante entre les sessions. Les développeurs doivent réexpliquer l'architecture, les schémas de base de données et les décisions précédentes à chaque nouvelle session, gaspillant du temps et de l'espace dans la fenêtre de contexte. Bien que Claude Code offre certains outils comme --continue pour reprendre les conversations, la mémoire automatique qui enregistre des notes dans des fichiers markdown, et la documentation de projet CLAUDE.md, ceux-ci ont des limites :

  • --continue ou --resume restaurent l'intégralité des fils de discussion mais consomment de l'espace dans la fenêtre de contexte et ne fonctionnent qu'avec un seul fil à la fois
  • La mémoire automatique charge les 200 premières lignes de MEMORY.md mais manque d'intelligence de récupération—elle ne sait pas quelles notes sont pertinentes pour le travail en cours
  • Les documents de projet comme CLAUDE.md fonctionnent pour les informations stables mais deviennent rapidement obsolètes dans les projets en évolution rapide

AgentWorkingMemory résout ces problèmes en accumulant des connaissances entre les sessions, en mettant en avant le contexte pertinent pour le travail actuel, et en s'améliorant avec le temps sans gestion manuelle.

Ad

Comment cela fonctionne

AWM fonctionne entièrement localement sur votre machine, sans dépendance au cloud. Le système se compose de :

  • Une base de données SQLite pour le stockage
  • Trois modèles ML locaux (~124 Mo au total, téléchargés une fois et mis en cache)
  • Un processus Node.js

Il n'y a pas de serveur à exécuter, pas de conteneur Docker, et pas de démon en arrière-plan. Lorsque vous démarrez Claude Code, il lance automatiquement AWM via MCP (Model Context Protocol). Lorsque vous fermez la session, il s'arrête. Tout reste local—pas de cloud, pas de clés API, pas de données quittant votre machine. Pour une sécurité supplémentaire, AWM prend en charge l'authentification par jeton porteur pour verrouiller l'accès à l'API de mémoire.

Configuration et utilisation

L'installation nécessite deux commandes :

npm install -g agent-working-memory
awm setup --global

Après avoir redémarré Claude Code, 14 outils de mémoire apparaissent automatiquement. La première session prend environ 30 secondes pendant le téléchargement des modèles ML (~124 Mo, mis en cache ensuite). À partir de là :

  • L'agent enregistre des souvenirs lorsqu'il apprend quelque chose d'important
  • Il rappelle les souvenirs pertinents lorsqu'il commence un nouveau travail
  • Il sauvegarde son état pour récupérer après des interruptions

Le système a été développé lors de la refonte d'une base de code vieille de 20 ans (~1,4 million de lignes) vers une pile moderne (~250 000 lignes estimées), spécifiquement pour une plateforme de gestion d'adhésions avec 88 tables de base de données et un développement multi-sprints utilisant plusieurs agents d'IA en parallèle.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Aperçus pratiques sur l'utilisation d'OpenClaw avec les LLM : défis et limites
Tools

Aperçus pratiques sur l'utilisation d'OpenClaw avec les LLM : défis et limites

Un utilisateur d'OpenClaw décrit des problèmes d'intégration avec les LLM, citant des réponses absurdes d'un bot Discord.

OpenClawRadar
L'outil de correction de mémoire OpenClaw résout la dégradation des performances.
Tools

L'outil de correction de mémoire OpenClaw résout la dégradation des performances.

Une nouvelle commande slash appelée /claw_memory_fix aide à nettoyer les fichiers mémoire d'OpenClaw lorsque l'agent oublie les identifiants ou les autorisations. L'outil met en œuvre des techniques provenant d'Alibaba, de l'ingénierie GitHub, de MemGPT et de recherches de janvier 2026 sur la gestion de la mémoire.

OpenClawRadar
GLM-5-Turbo présente un faible taux d'erreur d'appel d'outils lors des tests utilisateurs.
Tools

GLM-5-Turbo présente un faible taux d'erreur d'appel d'outils lors des tests utilisateurs.

Le modèle z-ai/glm-5-turbo présente un taux d'erreur moyen de 0,57 % lors des appels d'outils en test, ce qui est nettement inférieur au taux d'environ 3 % du GLM-5. Un utilisateur a rapporté l'avoir utilisé avec succès avec un outil CLI pour écrire un roman fantastique de 97 000 mots avec très peu de problèmes.

OpenClawRadar
Construction d'un agent de codage pour un contexte de 8k : répartition planificateur/exécuteur, budgétisation des jetons et exécution parallèle
Tools

Construction d'un agent de codage pour un contexte de 8k : répartition planificateur/exécuteur, budgétisation des jetons et exécution parallèle

Un aperçu détaillé de la construction d'un agent de codage CLI conçu pour des limites de 8 000 tokens, utilisant une architecture planificateur/exécuteur, un budget strict de tokens et une exécution parallèle des tâches.

OpenClawRadar