Rival-Review : Une boucle d'évaluation croisée pour les plans d'agents IA

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
Rival-Review : Une boucle d'évaluation croisée pour les plans d'agents IA
Ad

Ce que c'est

Rival-review est un outil qui aborde un schéma courant où les agents d'IA de codage élaborent des plans plausibles qui démarrent l'exécution sans avoir été correctement testés sous pression. L'idée centrale est simple : le modèle qui propose le plan n'est pas celui qui le révise.

Comment ça fonctionne

La boucle est simple :

  • Le planificateur écrit un plan
  • Claude le révise par rapport au contexte défini
  • Les problèmes sont renvoyés pour révision
  • La boucle continue jusqu'à ce que la validation soit passée ou que le nombre maximal de tours soit atteint

Le second modèle audite le plan en lecture seule avant le début de l'implémentation. Cette révision croisée entre modèles détecte des éléments qui ne sont pas seulement des "améliorations de plan" :

  • Des plans de retour arrière qui ne permettent pas réellement de revenir en arrière
  • Des conceptions d'autorisations avec de véritables failles de sécurité
  • Des portes de révision prenant des décisions d'approbation/rejet basées sur des états obsolètes
  • Des plans multi-étapes qui semblent cohérents jusqu'à ce qu'un second modèle parcoure l'ensemble du flux
Ad

Choix de conception clés

Plusieurs choix de conception se sont avérés très importants :

  • Le réviseur doit être en lecture seule
  • La boucle automatique nécessite une limite stricte de tours
  • Le contexte défini est très important
  • Un tableau de bord de terminal en direct rend la boucle de révision inspectable au lieu d'être opaque

Détails d'implémentation

L'outil fonctionne avec différents planificateurs :

  • Claude Code peut utiliser un crochet natif de sortie de plan
  • Codex et autres orchestrateurs peuvent utiliser une porte de planification explicite

Le créateur l'a utilisé pour aider à le construire lui-même : Codex a planifié, Claude a révisé, et la conception a convergé sur plusieurs tours.

Disponibilité

L'outil est sous licence MIT et disponible sur GitHub à github.com/alexw5702-afk/rival-review.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Dévoilement d'OpenClaw : Comment il renforce les agents d'IA en programmation
Tools

Dévoilement d'OpenClaw : Comment il renforce les agents d'IA en programmation

Découvrez comment OpenClaw transforme les agents de codage IA, propulsant l'automatisation dans divers domaines.

OpenClawRadar
🦀
Tools

Usage4Claude 3.0.0 : Traqueur de barre de menus macOS open source pour Claude et Codex

Usage4Claude 3.0.0 ajoute la prise en charge optionnelle de Codex, la connexion intégrée au navigateur pour Claude, le changement de compte multiples et des notifications localisées.

OpenClawRadar
Le Tableau de Bord de Code de Claude Suit Plus de 19 Millions de Commits Générés par l'IA sur GitHub
Tools

Le Tableau de Bord de Code de Claude Suit Plus de 19 Millions de Commits Générés par l'IA sur GitHub

Un développeur a créé un tableau de bord qui suit plus de 19 millions de commits générés par Claude Code sur les dépôts publics GitHub, montrant TypeScript (35,3 %), Python (19,2 %) et JavaScript (10,3 %) comme les langages les plus utilisés. Le système utilise Next.js avec Recharts et PostgreSQL, avec un pipeline ETL qui contourne les limites de taux de l'API GitHub.

OpenClawRadar
Claude Code v2.1.143 : Application des dépendances de plugins, valeurs par défaut PowerShell et corrections de sessions en arrière-plan
Tools

Claude Code v2.1.143 : Application des dépendances de plugins, valeurs par défaut PowerShell et corrections de sessions en arrière-plan

Anthropic a publié Claude Code v2.1.143 avec application des dépendances de plugins, PowerShell -ExecutionPolicy Bypass, nouvelle option d'isolation worktree et de nombreuses corrections pour les sessions en arrière-plan, Windows Terminal et l'accès aux fichiers macOS.

OpenClawRadar