Arquitectura de Validación en Frío: Sistema de Revisión de Código con Agentes Duales de Código Abierto

✍️ OpenClawRadar📅 Publicado: 31 de marzo de 2026🔗 Source
Arquitectura de Validación en Frío: Sistema de Revisión de Código con Agentes Duales de Código Abierto
Ad

Cold Validation Architecture es un sistema de código abierto que implementa validación de doble agente para código generado por IA. Un agente escribe el código, mientras que un agente separado lo revisa de forma independiente sin acceso al razonamiento o contexto del constructor.

Cómo funciona

El sistema aborda el sesgo de autorrevisión de un solo agente aplicando una separación de funciones similar a las auditorías independientes. El revisor opera en completo aislamiento del proceso de pensamiento del constructor.

Fases del flujo de trabajo

  • Escribir plan/review-plan (Puerta A)
  • Implementar/review-impl (Puerta C)
  • Enviar/acceptance-report (Puerta D)

Detalles clave de implementación

  • El revisor se ejecuta en un directorio temporal aislado
  • El revisor solo ve: documento de plan, diferencia de código y resultado de pruebas
  • Los hallazgos persisten con huellas digitales para seguimiento
  • El constructor puede estar en desacuerdo con la justificación del revisor
  • Máximo 2 rondas por fase
  • Construido con scripts bash y esquemas JSON
  • Actualmente funciona con Claude Code + Codex CLI
  • El patrón es independiente del agente (puede funcionar con diferentes agentes de IA)
Ad

Especificaciones técnicas

El sistema se implementa como scripts bash que coordinan entre dos agentes de IA separados. Los esquemas JSON definen la estructura para documentos de plan, revisiones de código e informes de aceptación. El entorno de ejecución aislado garantiza que el revisor no tenga acceso al razonamiento interno o pasos intermedios del constructor.

Este enfoque es útil para desarrolladores que desean implementar una validación más rigurosa para código generado por IA, particularmente cuando trabajan con sistemas complejos donde la autorrevisión de un solo agente podría introducir sesgo de confirmación.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Actualizaciones de CodeLedger y Vibecop para el Seguimiento de Costos y Calidad en Codificación con IA Multi-Agente
Herramientas

Actualizaciones de CodeLedger y Vibecop para el Seguimiento de Costos y Calidad en Codificación con IA Multi-Agente

CodeLedger ahora rastrea el gasto en Claude Code, Codex CLI, Cline y Gemini CLI leyendo archivos de sesión locales, mientras que Vibecop agrega verificaciones de calidad automatizadas con nuevos detectores específicos para LLM y una configuración de un solo comando para múltiples herramientas de codificación con IA.

OpenClawRadar
Reductor de Tokens: Un Complemento de Código Claude para la Compresión Inteligente de Contexto
Herramientas

Reductor de Tokens: Un Complemento de Código Claude para la Compresión Inteligente de Contexto

Token Reducer es un complemento de Claude Code que procesa el contexto del repositorio localmente para reducir el uso de tokens en un 90-98% mediante fragmentación basada en AST, recuperación híbrida y compresión TextRank. Está licenciado bajo MIT y disponible en el mercado de complementos.

OpenClawRadar
OpenClaw-WebTop: Ejecuta OpenClaw con Ollama y Ubuntu Desktop en GitHub Codespaces
Herramientas

OpenClaw-WebTop: Ejecuta OpenClaw con Ollama y Ubuntu Desktop en GitHub Codespaces

OpenClaw-WebTop proporciona una forma de ejecutar una instancia completa de OpenClaw con Ollama y el escritorio Ubuntu MATE directamente en un navegador usando GitHub Codespaces, sin necesidad de instalación local de Docker o un VPS.

OpenClawRadar
Codesight CLI reduce el uso de tokens de agentes de codificación con IA al escanear bases de código.
Herramientas

Codesight CLI reduce el uso de tokens de agentes de codificación con IA al escanear bases de código.

Codesight es una herramienta CLI sin dependencias que escanea proyectos de TypeScript, Python y Go para generar archivos de contexto compactos, reduciendo los tokens de exploración de Claude Code en 12.3× en promedio según benchmarks de codebases reales de producción.

OpenClawRadar