Mémoire IA à 3 Couches : Principes du Système de Claude

Principes d'Architecture de la Mémoire

L'équipe Claude Code a partagé le fonctionnement de leur système de mémoire, révélant des principes clés : la mémoire est un index, pas un stockage. MEMORY.md contient uniquement des pointeurs (150 caractères par ligne), avec les connaissances réelles dans des fichiers séparés récupérés à la demande. Les transcriptions brutes ne sont jamais chargées—seulement parcourues (grepped) lorsque nécessaire. Trois couches existent, chacune avec des coûts d'accès différents. Le principe le plus marquant : si quelque chose est dérivable, ne le stockez pas. La récupération est sceptique—la mémoire est un indice, pas une vérité, et le modèle vérifie avant d'utiliser.

Implémentation de Vektori

Vektori applique les mêmes principes avec une forme différente. Alors que Claude utilise une hiérarchie de fichiers, Vektori met en œuvre un graphe de phrases hiérarchique avec trois couches :

COUCHE FAIT (L0) — Énoncés précis servant de surface de recherche. Peu coûteux et toujours interrogeables.
COUCHE ÉPISODE (L1) — Épisodes à travers les conversations, découverts automatiquement.
COUCHE PHRASE (L2) — Conversation brute, récupérée uniquement lorsque explicitement nécessaire.

Le même modèle d'accès s'applique : L0 est votre index, L2 est votre transcription (parcourue, non déversée). Vous payez pour ce dont vous avez besoin.

Discipline d'Écriture Stricte

Rien n'entre dans L0 sans passer par des filtres de qualité : nombre minimum de caractères, vérification de la densité du contenu, ratio de pronoms. Si une phrase est trop vague ou purement du remplissage, elle ne devient jamais un fait. Cela correspond au principe de Claude de ne pas stocker les choses dérivables.

Mécanismes de Récupération

La récupération fonctionne comme Claude le décrit : notée, seuillée, sceptique. Score minimum de 0,3 avant que quoi que ce soit n'émerge. Les résultats sont classés par similarité vectorielle plus une décroissance temporelle, non récupérés aveuglément.

Divergence Architecturale sur les Corrections

L'approche de Claude optimise pour des contextes de projet à utilisateur unique où l'état le plus récent compte. Vektori, conçu pour des agents travaillant sur des centaines de sessions, conserve l'historique des corrections. Lorsqu'un utilisateur change d'avis, l'ancien fait reste dans le graphe avec ses liens de phrases, permettant de retracer ce qui a été dit avant le changement et pourquoi il a été remplacé.

Performance et Avenir

Sur LongMemEval-S, Vektori a atteint 73 % de précision à la profondeur L1 en utilisant BGE-M3 + Gemini Flash-2.5-lite. La résolution de conflits multi-sauts—où l'on raisonne sur la façon dont un fait a changé au fil du temps—est là où les systèmes basés sur des triples (sujet-objet-prédicat) s'effondrent. La couche suivante implique de stocker le pourquoi : des arêtes causales entre les événements (« l'utilisateur a corrigé X, l'agent a mis à jour Y, l'utilisateur a contesté à nouveau ») extraites de manière asynchrone et interrogeables sous forme de graphe. Les trajectoires de l'agent deviennent la mémoire—le comportement propre de l'agent fait partie de ce dont il peut raisonner.

📖 Read the full source: r/ClaudeAI