Architecture de la Mémoire de Vektori : Principes du Système Fuité de Claude

Principes d'Architecture de la Mémoire
L'équipe Claude Code a partagé le fonctionnement de leur système de mémoire, révélant des principes clés : la mémoire est un index, pas un stockage. MEMORY.md contient uniquement des pointeurs (150 caractères par ligne), avec les connaissances réelles dans des fichiers séparés récupérés à la demande. Les transcriptions brutes ne sont jamais chargées—seulement parcourues (grepped) lorsque nécessaire. Trois couches existent, chacune avec des coûts d'accès différents. Le principe le plus marquant : si quelque chose est dérivable, ne le stockez pas. La récupération est sceptique—la mémoire est un indice, pas une vérité, et le modèle vérifie avant d'utiliser.
Implémentation de Vektori
Vektori applique les mêmes principes avec une forme différente. Alors que Claude utilise une hiérarchie de fichiers, Vektori met en œuvre un graphe de phrases hiérarchique avec trois couches :
- COUCHE FAIT (L0) — Énoncés précis servant de surface de recherche. Peu coûteux et toujours interrogeables.
- COUCHE ÉPISODE (L1) — Épisodes à travers les conversations, découverts automatiquement.
- COUCHE PHRASE (L2) — Conversation brute, récupérée uniquement lorsque explicitement nécessaire.
Le même modèle d'accès s'applique : L0 est votre index, L2 est votre transcription (parcourue, non déversée). Vous payez pour ce dont vous avez besoin.
Discipline d'Écriture Stricte
Rien n'entre dans L0 sans passer par des filtres de qualité : nombre minimum de caractères, vérification de la densité du contenu, ratio de pronoms. Si une phrase est trop vague ou purement du remplissage, elle ne devient jamais un fait. Cela correspond au principe de Claude de ne pas stocker les choses dérivables.
Mécanismes de Récupération
La récupération fonctionne comme Claude le décrit : notée, seuillée, sceptique. Score minimum de 0,3 avant que quoi que ce soit n'émerge. Les résultats sont classés par similarité vectorielle plus une décroissance temporelle, non récupérés aveuglément.
Divergence Architecturale sur les Corrections
L'approche de Claude optimise pour des contextes de projet à utilisateur unique où l'état le plus récent compte. Vektori, conçu pour des agents travaillant sur des centaines de sessions, conserve l'historique des corrections. Lorsqu'un utilisateur change d'avis, l'ancien fait reste dans le graphe avec ses liens de phrases, permettant de retracer ce qui a été dit avant le changement et pourquoi il a été remplacé.
Performance et Avenir
Sur LongMemEval-S, Vektori a atteint 73 % de précision à la profondeur L1 en utilisant BGE-M3 + Gemini Flash-2.5-lite. La résolution de conflits multi-sauts—où l'on raisonne sur la façon dont un fait a changé au fil du temps—est là où les systèmes basés sur des triples (sujet-objet-prédicat) s'effondrent. La couche suivante implique de stocker le pourquoi : des arêtes causales entre les événements (« l'utilisateur a corrigé X, l'agent a mis à jour Y, l'utilisateur a contesté à nouveau ») extraites de manière asynchrone et interrogeables sous forme de graphe. Les trajectoires de l'agent deviennent la mémoire—le comportement propre de l'agent fait partie de ce dont il peut raisonner.
📖 Read the full source: r/ClaudeAI
👀 See Also

certctl : Plateforme de gestion du cycle de vie des certificats auto-hébergée, offrant 78 points d'API pour l'automatisation par agents IA.
certctl est une plateforme de gestion du cycle de vie des certificats auto-hébergée, développée en Go et TypeScript, qui expose 78 points d'API REST pour la gestion des certificats. La plateforme est indépendante des émetteurs et des cibles, avec un serveur MCP prévu pour exposer toutes les fonctionnalités en tant qu'outils MCP natifs.

Graphe de Compétences Traversable pour la Mémoire Persistante des Agents IA dans les Bases de Code
Un développeur a construit un système de graphe de compétences à trois couches qui vit à l'intérieur d'une base de code, permettant aux assistants de codage IA de maintenir une mémoire persistante entre les sessions. Le système utilise une divulgation progressive avec des instructions auto-dirigées au lieu de fichiers de contexte monolithiques.

LLMSpend : Traqueur de coûts open-source pour les SDKs Anthropic et OpenAI
LLMSpend est une bibliothèque Python qui ajoute le suivi des coûts aux appels SDK d'Anthropic et d'OpenAI avec seulement deux lignes de code. Il offre un stockage SQLite local, des rapports en ligne de commande et un tableau de bord web sans envoyer de données à l'extérieur.

BaseLayer : Pipeline de Compression Comportementale Open-Source pour les Systèmes de Mémoire IA
BaseLayer est un pipeline open-source qui extrait les croyances, comportements, tensions et contradictions des conversations, journaux et textes publiés, les comprimant en un profil d'identité pour les modèles d'IA. Il a été testé sur des ensembles de données allant de 8 entrées de journal personnel à de grands corpus comme les lettres aux actionnaires de Warren Buffett (350 000 mots) et les mémos d'investissement de Howard Marks (600 000 mots).