Validation Froide Open Source : Revue de Code à Double Agent

L'Architecture de Validation Froide est un système open source qui met en œuvre une validation à double agent pour le code généré par IA. Un agent écrit le code, tandis qu'un agent séparé le révise indépendamment sans accès au raisonnement ou au contexte du constructeur.

Fonctionnement

Le système aborde le biais d'auto-révision à agent unique en appliquant une séparation des tâches similaire aux audits indépendants. Le réviseur opère en isolation complète du processus de réflexion du constructeur.

Phases du flux de travail

Écrire le plan → /review-plan (Porte A)
Implémenter → /review-impl (Porte C)
Livrer → /acceptance-report (Porte D)

Détails clés de mise en œuvre

Le réviseur s'exécute dans un répertoire temporaire isolé
Le réviseur ne voit que : le document de plan, la différence de code et la sortie des tests
Les constatations persistent avec des empreintes pour le suivi
Le constructeur peut être en désaccord avec la justification du réviseur
Maximum 2 tours par phase
Construit avec des scripts bash et des schémas JSON
Fonctionne actuellement avec Claude Code + Codex CLI
Le modèle est agnostique aux agents (peut fonctionner avec différents agents IA)

Spécifications techniques

Le système est implémenté sous forme de scripts bash qui coordonnent deux agents IA distincts. Des schémas JSON définissent la structure des documents de plan, des revues de code et des rapports d'acceptation. L'environnement d'exécution isolé garantit que le réviseur n'a accès ni au raisonnement interne du constructeur ni aux étapes intermédiaires.

Cette approche est utile pour les développeurs qui souhaitent mettre en œuvre une validation plus rigoureuse du code généré par IA, en particulier lorsqu'ils travaillent sur des systèmes complexes où l'auto-révision à agent unique pourrait introduire un biais de confirmation.

📖 Lire la source complète : r/LocalLLaMA

Architecture de Validation Froide : Système de Revue de Code à Double Agent Libéré en Open Source

Fonctionnement

Phases du flux de travail

Détails clés de mise en œuvre

Spécifications techniques

👀 See Also

Claude Sleuth : Un flux de travail d'investigation en 56 tâches pour Claude AI

Attesor : Rétro-ingénierie assistée par l'IA de Rosetta 2 pour machine virtuelle Linux

Claudeck : Interface navigateur pour Claude Code avec Agents, Suivi des Coûts et Système de Plugins

uimax-mcp : Serveur MCP gratuit pour la revue et la correction automatisée du code frontend avec Claude Code