Révision inter-modèles pour agents IA : détection des défauts

Fonctionnement de l'examen croisé de modèles

Un développeur sur r/ClaudeAI a construit un système qui résout un problème courant avec les agents de codage IA comme Codex, Claude Code et Cursor : les plans sont exécutés sans que leurs hypothèses ne soient d'abord remises en question. La solution consiste à faire passer chaque plan par un second modèle d'IA avec une architecture et des données d'entraînement différentes avant le début de l'exécution.

Détails clés de l'implémentation

Le modèle examinateur est en lecture seule et ne peut pas toucher au code — il ne peut que remettre en question le plan. Cette contrainte est cruciale car « au moment où il peut modifier, il cesse d'être un critique et commence à compromettre ». Le système exécute une boucle automatique avec une limite de tours : les plans retournent pour révision si des problèmes sont détectés jusqu'à ce qu'ils soient validés ou atteignent la limite.

Ce que le système détecte

Plans de restauration qui ne restaurent pas réellement
Conceptions d'autorisations avec de véritables failles de sécurité
Portes de revue prenant des décisions go/no-go à partir d'un état obsolète
Plans en plusieurs étapes qui semblent cohérents jusqu'à ce qu'un second modèle parcoure l'ensemble du flux

Décisions de conception critiques

Le contexte d'examen limité empêche l'examinateur de perdre du temps à lire des parties non pertinentes du dépôt
Les personnages de l'examinateur (risque de livraison, reproductibilité, performance-coût, sécurité-conformité) détectent différents types de problèmes
Un tableau de bord TUI en direct affiche la phase, le tour, le verdict, la gravité, le coût et l'historique dans une seule vue terminal
Le système fonctionne avec différents planificateurs : Claude Code utilise un crochet natif ExitPlanMode tandis que Codex et d'autres orchestrateurs utilisent une porte explicite

Résultats pratiques

Le développeur a utilisé le système pour aider à le construire lui-même : « Codex a planifié, Claude a examiné les plans, et la conception a convergé sur plusieurs tours. » L'outil est sous licence MIT et disponible sous le nom rival-review sur GitHub.

📖 Read the full source: r/ClaudeAI

Boucle de révision inter-modèles pour les agents d'IA de codage : détection des défauts critiques de planification

Fonctionnement de l'examen croisé de modèles

Détails clés de l'implémentation

Ce que le système détecte

Décisions de conception critiques

Résultats pratiques

👀 See Also

Claude débogue et corrige son propre bug de serveur de système de fichiers MCP pour les chemins UNC sous Windows

CodeLedger : Le plugin open-source Claude Code suit l'utilisation des jetons et les agents en arrière-plan.

Org Studio : Tableau de bord open source pour gérer des équipes d'IA multi-agents

Terminal CRM Local avec Serveur MCP Intégré pour l'Intégration Claude