Revisión Intermodelo: Detecta Fallas en Agentes de Codificación

Cómo funciona la revisión entre modelos

Un desarrollador en r/ClaudeAI construyó un sistema que aborda un problema común con los agentes de IA de codificación como Codex, Claude Code y Cursor: los planes se ejecutan sin que nadie cuestione primero sus suposiciones. La solución dirige cada plan a través de un segundo modelo de IA con diferente arquitectura y datos de entrenamiento antes de que comience la ejecución.

Detalles clave de implementación

El modelo revisor es de solo lectura y no puede tocar el código—solo puede cuestionar el plan. Esta restricción es crítica porque "en el momento en que puede editar, deja de ser un crítico y comienza a comprometer". El sistema ejecuta un bucle automático con un límite de rondas: los planes regresan para revisión si se encuentran problemas hasta que pasan o alcanzan el límite.

Lo que detecta el sistema

Planes de reversión que en realidad no revierten
Diseños de permisos con agujeros de seguridad reales
Puertas de revisión que toman decisiones de continuar/detener desde un estado obsoleto
Planes de múltiples pasos que suenan coherentes hasta que un segundo modelo recorre todo el flujo

Decisiones de diseño críticas

El contexto de revisión delimitado evita que el revisor pierda tiempo leyendo partes irrelevantes del repositorio
Las personalidades del revisor (riesgo de entrega, reproducibilidad, rendimiento-costo, seguridad-cumplimiento) detectan diferentes tipos de problemas
Un panel de control TUI en vivo muestra fase, ronda, veredicto, gravedad, costo e historial en una sola vista de terminal
El sistema funciona con diferentes planificadores: Claude Code usa un gancho nativo ExitPlanMode mientras que Codex y otros orquestadores usan una puerta explícita

Resultados prácticos

El desarrollador usó el sistema para ayudar a construirse a sí mismo: "Codex planificó, Claude revisó los planes, y el diseño convergió a través de múltiples rondas". La herramienta tiene licencia MIT y está disponible como rival-review en GitHub.

📖 Read the full source: r/ClaudeAI

Bucle de Revisión Intermodelo para Agentes de Codificación de IA Detecta Fallas Críticas en la Planificación

Cómo funciona la revisión entre modelos

Detalles clave de implementación

Lo que detecta el sistema

Decisiones de diseño críticas

Resultados prácticos

👀 Ver también

Construyendo una Infraestructura de Conocimiento de IA Persistente con OpenClaw

cowork-session-sync v1.0.0 proporciona continuidad de sesión para Claude Cowork.

companion-capture: Herramienta guarda las burbujas de habla efímeras de Claude Code

Ahora diseño más con Claude que con Figma — flujo de trabajo de diseñador de Jane Street