Graphe de Compétences Traversable pour la Mémoire Persistante des Agents IA dans les Bases de Code

Une Solution Pratique pour les Assistants IA sans État
Les assistants de codage IA manquent de mémoire persistante entre les sessions, forçant les développeurs à repartir de zéro à chaque fois. L'approche courante qui consiste à tout déverser dans de grands fichiers de règles comme .cursorrules échoue en raison des limites de tokens et de la dilution des instructions.
La solution présentée est une divulgation progressive via un graphe de compétences traversable qui vit à l'intérieur de la base de code. L'IA navigue ce graphe de manière autonome à travers les sessions.
Architecture à Trois Couches
Le système possède trois couches distinctes :
- Couche 1 (Toujours Chargée) : Moins de 150 lignes (300 tokens). Contient l'identité de la pile, les conventions de dossiers et les non-négociables. Inclut un pointeur sortant vers
HANDOVER.md. - Couche 2 (Chargée Par Session) :
HANDOVER.mdsert de routeur d'attention, pas de document. Il indique à l'IA quel fichier de domaine charger en fonction de la tâche actuelle (paiements, authentification, base de données, routes API). Chaque fichier de domaine se termine par des instructions pointant vers le fichier suivant pertinent, créant un système auto-dirigé. - Couche 3 (Chargée Par Tâche) : Bibliothèque d'invites avec 12 catégories. Chaque entrée comprend des sections de contexte, construction, vérification et débogage. L'IA consulte l'index, charge la catégorie et suit le modèle.
Idée Clé : Instructions Auto-Dirigées
L'innovation principale est que les instructions portent du sens, pas seulement des références. Par exemple : "chargez security/threat-modeling.md avant de modifier les gestionnaires de webhooks" indique à l'IA quand et pourquoi, pas seulement quoi.
Le développeur a intégré cela dans un modèle SaaS livré avec la base de code, disponible sur launchx.page pour ceux qui souhaitent examiner la structure complète du graphe.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

PhAIL Benchmark Évalue les Modèles VLA sur des Tâches Réelles de Robotique d'Entrepôt
PhAIL est un benchmark pour robots réels qui teste quatre modèles vision-langage-action sur la préparation de commandes entre bacs à l'aide d'un robot Franka FR3. Le meilleur modèle a atteint 64 unités par heure, contre 330 UPH pour la téléopération humaine et plus de 1 300 UPH pour le travail manuel humain.

yburn : Outil pour auditer et remplacer les tâches cron inutiles des agents IA
yburn est un outil Python qui audite les tâches cron des agents d'IA et remplace celles qui n'ont pas besoin de LLM par des scripts Python autonomes. Le créateur a constaté que 58 % des 98 tâches cron étaient des tâches purement mécaniques comme des vérifications de santé système et des sauvegardes git.

Système d'auto-audit à 4 niveaux pour l'évolution comportementale d'OpenClaw
Un développeur a créé un système d'audit à 4 couches où Gemini examine chaque semaine les angles morts de Claude, détectant des schémas que Claude avait manqués lors de son auto-évaluation. Le système comprend une vérification post-correction, l'extraction de motifs, un miroir externe et des vérifications attentes vs réalité.

Audit SecureCode : Un auditeur de sécurité de serveur Linux construit avec Claude Code
Un développeur indépendant a créé SecureCode Audit à l'aide de Claude Code — exécutez une commande SSH, obtenez un rapport de sécurité avec 22 vérifications et des correctifs priorisés. Les 30 premiers inscrits reçoivent l'audit complet gratuitement.