Architecture de Validation Froide : Système de Revue de Code à Double Agent Libéré en Open Source

L'Architecture de Validation Froide est un système open source qui met en œuvre une validation à double agent pour le code généré par IA. Un agent écrit le code, tandis qu'un agent séparé le révise indépendamment sans accès au raisonnement ou au contexte du constructeur.
Fonctionnement
Le système aborde le biais d'auto-révision à agent unique en appliquant une séparation des tâches similaire aux audits indépendants. Le réviseur opère en isolation complète du processus de réflexion du constructeur.
Phases du flux de travail
- Écrire le plan →
/review-plan(Porte A) - Implémenter →
/review-impl(Porte C) - Livrer →
/acceptance-report(Porte D)
Détails clés de mise en œuvre
- Le réviseur s'exécute dans un répertoire temporaire isolé
- Le réviseur ne voit que : le document de plan, la différence de code et la sortie des tests
- Les constatations persistent avec des empreintes pour le suivi
- Le constructeur peut être en désaccord avec la justification du réviseur
- Maximum 2 tours par phase
- Construit avec des scripts bash et des schémas JSON
- Fonctionne actuellement avec Claude Code + Codex CLI
- Le modèle est agnostique aux agents (peut fonctionner avec différents agents IA)
Spécifications techniques
Le système est implémenté sous forme de scripts bash qui coordonnent deux agents IA distincts. Des schémas JSON définissent la structure des documents de plan, des revues de code et des rapports d'acceptation. L'environnement d'exécution isolé garantit que le réviseur n'a accès ni au raisonnement interne du constructeur ni aux étapes intermédiaires.
Cette approche est utile pour les développeurs qui souhaitent mettre en œuvre une validation plus rigoureuse du code généré par IA, en particulier lorsqu'ils travaillent sur des systèmes complexes où l'auto-révision à agent unique pourrait introduire un biais de confirmation.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Claude Sleuth : Un flux de travail d'investigation en 56 tâches pour Claude AI
Claude Sleuth est un flux de travail d'investigation structuré pour Claude AI avec 6 phases et 56 tâches, incluant un stockage d'état persistant via Cloudflare D1 et des conventions de sortie standardisées comprenant des horodatages ISO 8601, des enregistrements d'entités POLE et le langage de probabilité ICD 203.

Attesor : Rétro-ingénierie assistée par l'IA de Rosetta 2 pour machine virtuelle Linux
Attesor est un projet GitHub qui utilise l'IA pour rétro-concevoir la technologie de traduction binaire Rosetta 2 d'Apple, visant à documenter son architecture et potentiellement permettre la traduction x86_64 vers ARM64 sur des machines virtuelles Linux.

Claudeck : Interface navigateur pour Claude Code avec Agents, Suivi des Coûts et Système de Plugins
Claudeck est une interface utilisateur basée sur navigateur qui encapsule le SDK Claude Code, offrant une orchestration d'agents autonomes, un suivi des coûts, une isolation de l'arbre de travail git, une mémoire persistante et un système de plugins. Installez avec npx claudeck@latest.

uimax-mcp : Serveur MCP gratuit pour la revue et la correction automatisée du code frontend avec Claude Code
uimax-mcp est un serveur MCP gratuit qui automatise la revue et la correction du code frontend en utilisant Claude Code. Avec une seule commande, il capture des captures d'écran, exécute des audits Lighthouse et d'accessibilité, recherche des anti-modèles et génère des corrections automatisées.