Système de mémoire basé sur les fichiers de Claude Code : une alternative pragmatique aux bases de données vectorielles

Claude Code utilise une approche basée sur des fichiers pour la mémoire des agents, remplaçant la configuration typique de base de données vectorielle et d'embeddings. Au lieu d'un RAG complet, il stocke les mémoires sous forme de fichiers .md avec de petites sections frontmatter contenant des informations de nom, description et type, plus un fichier MEMORY.md qui sert d'index.
Fonctionnement du système
Au moment de l'exécution, le système n'incorpore ni ne recherche tout. Il suit ce processus :
- Scanne les fichiers de mémoire (limités à environ 200, les plus récents en premier)
- Lit seulement les ~30 premières lignes (principalement des métadonnées)
- Construit un manifeste léger
- Utilise un petit modèle pour choisir les ~5 mémoires les plus pertinentes
- Charge uniquement ces mémoires sélectionnées dans le contexte (avec des limites de taille)
Avantages clés
La conception offre plusieurs avantages pratiques :
- Économique : Fichiers limités, tokens limités, coûts prévisibles
- Rapide : Aucune opération d'embedding ou de recherche de similarité
- Contrôlé : N'injecte que quelques mémoires avec des plafonds stricts partout
- Lisible par l'humain : Tout est stocké sous forme de fichiers markdown
- Moins de déchets : Évite explicitement de stocker des informations qui peuvent déjà être dérivées du dépôt
Le système traite la mémoire comme "potentiellement obsolète" plutôt que comme une vérité absolue, ce qui offre une approche rafraîchissante de la gestion de la mémoire des agents. Cette conception est particulièrement pragmatique pour les agents de codage et de débogage où la plupart des "mémoires" consistent en des préférences, du contexte ou des références externes plutôt que de grandes bases de connaissances.
Bien que cette approche ne remplace pas le RAG pour tous les cas d'utilisation, elle représente un bon compromis pour les agents de développement où la simplicité et la prévisibilité comptent plus qu'une récupération complète des connaissances.
📖 Read the full source: r/ClaudeAI
👀 See Also

Graphe de Compétences Traversable pour la Mémoire Persistante des Agents IA dans les Bases de Code
Un développeur a construit un système de graphe de compétences à trois couches qui vit à l'intérieur d'une base de code, permettant aux assistants de codage IA de maintenir une mémoire persistante entre les sessions. Le système utilise une divulgation progressive avec des instructions auto-dirigées au lieu de fichiers de contexte monolithiques.

Gonflement du contexte MCP : coûts réels et solution pratique pour les utilisateurs de Claude Code
L'exécution de 9 serveurs MCP dans Claude Code entraîne des démarrages à froid de 38k tokens, ~700 $/mois de frais généraux de définition d'outils et une dégradation des performances du modèle. Un modèle de passerelle avec classement BM25 réduit le contexte à 4k.

Pangolin : VPN à identité open-source en alternative au ZTNA
Pangolin est un VPN open-source axé sur l'accès à distance basé sur l'identité, offrant une alternative à Cloudflare ZTNA, Zscaler et Twingate.

Bespoke AI v0.8.1 : Extension d'auto-complétion VS Code pour le code et le texte
Bespoke AI v0.8.1 est une extension VS Code qui fournit une fonctionnalité d'autocomplétion à la fois pour le code et le texte, exploitant les abonnements Claude Code via le SDK Agent d'Anthropic pour éviter les frais d'API tout en prenant en charge plusieurs backends dont Ollama.