Serveur MCP Implémente le Document de Réflexion pour une Mémoire Persistante de l'Agent de Codage

Un développeur a implémenté l'article Reflexion (Shinn et al., NeurIPS 2023) en tant que serveur MCP pour résoudre un problème courant des agents de codage locaux : l'absence de mémoire persistante entre les sessions. L'outil, nommé reflect-mcp, permet aux agents de se souvenir et d'éviter de répéter les erreurs.
Fonctionnement
Le système fonctionne selon un flux structuré :
- Après chaque échec de test, l'agent critique son propre travail et extrait des motifs de l'erreur
- Ces leçons sont stockées pour référence future
- Avant de commencer de nouvelles tâches, l'agent rappelle les leçons passées en utilisant la recherche en texte intégral
- La correspondance de motifs est entièrement basée sur des expressions régulières - aucun appel LLM n'est nécessaire pour la classification
Le développeur note que les messages d'erreur sont suffisamment prévisibles pour qu'une correspondance déterministe fonctionne efficacement. L'agent écrit la critique puisqu'il a le contexte, tandis que le serveur gère la structuration et la déduplication des leçons.
Implémentation technique
- Construit en tant que serveur MCP (Model Context Protocol)
- Utilise SQLite avec FTS5 pour le stockage et la recherche
- Fonctionne avec tout client compatible MCP
- Installation via :
cargo install reflect-mcp
Résultats après une semaine
Le développeur a rapporté plusieurs améliorations dans le comportement de son agent de codage :
- Arrêté d'utiliser le même
unwrap()sur les entrées utilisateur - Arrêté d'oublier la gestion des fuseaux horaires
- Commencé à éviter automatiquement les motifs d'échec précédemment observés
- Le suivi des motifs a rendu visibles les erreurs récurrentes dans le projet
Le projet est disponible sur GitHub à https://github.com/rohansx/reflect. Le développeur sollicite les retours d'autres personnes ayant expérimenté des configurations de mémoire persistante pour les agents de codage locaux.
📖 Read the full source: r/LocalLLaMA
👀 See Also

ExposureGuard MCP Server ajoute l'analyse de sécurité des domaines à Claude Desktop
Un développeur a créé un serveur MCP pour l'analyse de sécurité des domaines en utilisant Claude Code, exposant quatre outils qui vérifient SPF, DMARC, SSL, les en-têtes de sécurité, DNSSEC, les ports ouverts, MX et HTTPS. Le serveur est disponible via pip install exposureguard-mcp avec un niveau gratuit de 100 appels API par jour.

OmniCoder-9B : Agent de codage à 9 milliards de paramètres affiné sur 425 000 trajectoires agentiques
Tesslate a publié OmniCoder-9B, un modèle d'agent de codage à 9 milliards de paramètres affiné sur l'architecture hybride de Qwen3.5-9B. Il a été entraîné sur plus de 425 000 trajectoires de codage agentique sélectionnées provenant de Claude Opus 4.6, GPT-5.4, GPT-5.3-Codex et Gemini 3.1 Pro.

Microsoft BitNet : un framework d'inférence LLM 1-bit pour CPU et GPU
Microsoft a publié BitNet, un framework d'inférence pour les LLM 1-bit qui permet des accélérations de 1,37x à 6,17x sur les CPU et réduit la consommation d'énergie de 55,4% à 82,2%. Il peut exécuter un modèle de 100 milliards de paramètres sur un seul CPU à une vitesse de 5 à 7 tokens par seconde.

Colony : Une couche de coordination locale qui réduit les jetons de transfert multi-agents de 30 000 à 400
Colony est un substrat de coordination local-first qui réduit les coûts de transfert multi-agents d'environ 30 000 jetons à environ 400 en remplaçant la relecture du contexte par des observations compactes stockées dans SQLite.