Rival-Review : Une boucle d'évaluation croisée pour les plans d'agents IA

Ce que c'est
Rival-review est un outil qui aborde un schéma courant où les agents d'IA de codage élaborent des plans plausibles qui démarrent l'exécution sans avoir été correctement testés sous pression. L'idée centrale est simple : le modèle qui propose le plan n'est pas celui qui le révise.
Comment ça fonctionne
La boucle est simple :
- Le planificateur écrit un plan
- Claude le révise par rapport au contexte défini
- Les problèmes sont renvoyés pour révision
- La boucle continue jusqu'à ce que la validation soit passée ou que le nombre maximal de tours soit atteint
Le second modèle audite le plan en lecture seule avant le début de l'implémentation. Cette révision croisée entre modèles détecte des éléments qui ne sont pas seulement des "améliorations de plan" :
- Des plans de retour arrière qui ne permettent pas réellement de revenir en arrière
- Des conceptions d'autorisations avec de véritables failles de sécurité
- Des portes de révision prenant des décisions d'approbation/rejet basées sur des états obsolètes
- Des plans multi-étapes qui semblent cohérents jusqu'à ce qu'un second modèle parcoure l'ensemble du flux
Choix de conception clés
Plusieurs choix de conception se sont avérés très importants :
- Le réviseur doit être en lecture seule
- La boucle automatique nécessite une limite stricte de tours
- Le contexte défini est très important
- Un tableau de bord de terminal en direct rend la boucle de révision inspectable au lieu d'être opaque
Détails d'implémentation
L'outil fonctionne avec différents planificateurs :
- Claude Code peut utiliser un crochet natif de sortie de plan
- Codex et autres orchestrateurs peuvent utiliser une porte de planification explicite
Le créateur l'a utilisé pour aider à le construire lui-même : Codex a planifié, Claude a révisé, et la conception a convergé sur plusieurs tours.
Disponibilité
L'outil est sous licence MIT et disponible sur GitHub à github.com/alexw5702-afk/rival-review.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Dévoilement d'OpenClaw : Comment il renforce les agents d'IA en programmation
Découvrez comment OpenClaw transforme les agents de codage IA, propulsant l'automatisation dans divers domaines.
Usage4Claude 3.0.0 : Traqueur de barre de menus macOS open source pour Claude et Codex
Usage4Claude 3.0.0 ajoute la prise en charge optionnelle de Codex, la connexion intégrée au navigateur pour Claude, le changement de compte multiples et des notifications localisées.

Le Tableau de Bord de Code de Claude Suit Plus de 19 Millions de Commits Générés par l'IA sur GitHub
Un développeur a créé un tableau de bord qui suit plus de 19 millions de commits générés par Claude Code sur les dépôts publics GitHub, montrant TypeScript (35,3 %), Python (19,2 %) et JavaScript (10,3 %) comme les langages les plus utilisés. Le système utilise Next.js avec Recharts et PostgreSQL, avec un pipeline ETL qui contourne les limites de taux de l'API GitHub.

Claude Code v2.1.143 : Application des dépendances de plugins, valeurs par défaut PowerShell et corrections de sessions en arrière-plan
Anthropic a publié Claude Code v2.1.143 avec application des dépendances de plugins, PowerShell -ExecutionPolicy Bypass, nouvelle option d'isolation worktree et de nombreuses corrections pour les sessions en arrière-plan, Windows Terminal et l'accès aux fichiers macOS.