Bucle de Revisión Intermodelo para Agentes de Codificación de IA Detecta Fallas Críticas en la Planificación

Cómo funciona la revisión entre modelos
Un desarrollador en r/ClaudeAI construyó un sistema que aborda un problema común con los agentes de IA de codificación como Codex, Claude Code y Cursor: los planes se ejecutan sin que nadie cuestione primero sus suposiciones. La solución dirige cada plan a través de un segundo modelo de IA con diferente arquitectura y datos de entrenamiento antes de que comience la ejecución.
Detalles clave de implementación
El modelo revisor es de solo lectura y no puede tocar el código—solo puede cuestionar el plan. Esta restricción es crítica porque "en el momento en que puede editar, deja de ser un crítico y comienza a comprometer". El sistema ejecuta un bucle automático con un límite de rondas: los planes regresan para revisión si se encuentran problemas hasta que pasan o alcanzan el límite.
Lo que detecta el sistema
- Planes de reversión que en realidad no revierten
- Diseños de permisos con agujeros de seguridad reales
- Puertas de revisión que toman decisiones de continuar/detener desde un estado obsoleto
- Planes de múltiples pasos que suenan coherentes hasta que un segundo modelo recorre todo el flujo
Decisiones de diseño críticas
- El contexto de revisión delimitado evita que el revisor pierda tiempo leyendo partes irrelevantes del repositorio
- Las personalidades del revisor (riesgo de entrega, reproducibilidad, rendimiento-costo, seguridad-cumplimiento) detectan diferentes tipos de problemas
- Un panel de control TUI en vivo muestra fase, ronda, veredicto, gravedad, costo e historial en una sola vista de terminal
- El sistema funciona con diferentes planificadores: Claude Code usa un gancho nativo ExitPlanMode mientras que Codex y otros orquestadores usan una puerta explícita
Resultados prácticos
El desarrollador usó el sistema para ayudar a construirse a sí mismo: "Codex planificó, Claude revisó los planes, y el diseño convergió a través de múltiples rondas". La herramienta tiene licencia MIT y está disponible como rival-review en GitHub.
📖 Read the full source: r/ClaudeAI
👀 Ver también

FixAI Dev: Un Juego de Derechos del Consumidor Usando Claude Haiku con Contratos JSON Estrictos
Un desarrollador creó un juego de navegador donde Claude Haiku actúa como una IA corporativa que niega solicitudes de consumidores; los jugadores argumentan utilizando leyes reales de protección al consumidor en 37 casos de la UE, EE. UU., Reino Unido y Australia. La arquitectura usa Haiku solo para el lenguaje, con lógica del juego en el servidor y contratos JSON estrictos entre componentes.

Script de PowerShell automatiza la configuración de Docker para OpenClaw en Windows
Un script de PowerShell maneja las peculiaridades específicas de Windows en la red y la configuración de Docker para OpenClaw, automatizando comprobaciones, obtención de imágenes, guía de configuración e implementación de contenedores.

Usando Claude Code para revitalizar proyectos personales abandonados: una guía práctica
Matthew Brunelle comparte cómo usó Claude Code (con Opus 4.6) para resucitar un proyecto de shim entre YouTube Music y la API de OpenSubsonic que estaba estancado, incluyendo pasos de configuración, indicaciones y consejos de flujo de trabajo.

Auto Router vs Sonnet: Ahorro de Costos vs Calidad de Respuesta
La función Auto Router de Open Router selecciona dinámicamente modelos de lenguaje según la complejidad del contexto, ofreciendo ahorros significativos de costos (0.8 centavos vs 0.00071 centavos por solicitud), pero los usuarios reportan una calidad de respuesta degradada en comparación con Sonnet 4.6.