Rival-Review : Boucle d'évaluation croisée IA sous licence MIT

Ce que c'est

Rival-review est un outil qui aborde un schéma courant où les agents d'IA de codage élaborent des plans plausibles qui démarrent l'exécution sans avoir été correctement testés sous pression. L'idée centrale est simple : le modèle qui propose le plan n'est pas celui qui le révise.

Comment ça fonctionne

La boucle est simple :

Le planificateur écrit un plan
Claude le révise par rapport au contexte défini
Les problèmes sont renvoyés pour révision
La boucle continue jusqu'à ce que la validation soit passée ou que le nombre maximal de tours soit atteint

Le second modèle audite le plan en lecture seule avant le début de l'implémentation. Cette révision croisée entre modèles détecte des éléments qui ne sont pas seulement des "améliorations de plan" :

Des plans de retour arrière qui ne permettent pas réellement de revenir en arrière
Des conceptions d'autorisations avec de véritables failles de sécurité
Des portes de révision prenant des décisions d'approbation/rejet basées sur des états obsolètes
Des plans multi-étapes qui semblent cohérents jusqu'à ce qu'un second modèle parcoure l'ensemble du flux

Choix de conception clés

Plusieurs choix de conception se sont avérés très importants :

Le réviseur doit être en lecture seule
La boucle automatique nécessite une limite stricte de tours
Le contexte défini est très important
Un tableau de bord de terminal en direct rend la boucle de révision inspectable au lieu d'être opaque

Détails d'implémentation

L'outil fonctionne avec différents planificateurs :

Claude Code peut utiliser un crochet natif de sortie de plan
Codex et autres orchestrateurs peuvent utiliser une porte de planification explicite

Le créateur l'a utilisé pour aider à le construire lui-même : Codex a planifié, Claude a révisé, et la conception a convergé sur plusieurs tours.

Disponibilité

L'outil est sous licence MIT et disponible sur GitHub à github.com/alexw5702-afk/rival-review.

📖 Read the full source: r/LocalLLaMA

Rival-Review : Une boucle d'évaluation croisée pour les plans d'agents IA

Ce que c'est

Comment ça fonctionne

Choix de conception clés

Détails d'implémentation

Disponibilité

👀 See Also

Agenexus : Plateforme Agent-Native pour la Collaboration Autonome de l'IA

Développement local d'IA avec Qwen3.6-27B et Opencode sur un 5090

OpenClaw PARA Compétence Organise Automatiquement les Fichiers en Utilisant la Méthode de Tiago Forte.

Le format WCY réduit la surcharge de tokens des LLM de 50 à 71 % et ajoute des marqueurs structurels « Je ne sais pas ».