Arnés Generador-Evaluador de Anthropic replicado con Kiro CLI: 12 iteraciones

Un desarrollador replicó el diseño de arnés Generador-Evaluador de Anthropic para aplicaciones de larga duración, inspirado en las GANs. La arquitectura: un Planificador (se ejecuta una vez) y luego un bucle Generador ↔ Evaluador durante 12 iteraciones. Cada agente es un proceso CLI separado sin contexto compartido, comunicándose solo a través de archivos (spec.md, eval-report.md). El Evaluador usa Playwright para navegar por el sitio en vivo, no solo leer el código.

Detalles clave de la arquitectura

Pizarra limpia por invocación: Cada agente comienza de nuevo, leyendo solo sus archivos de entrada. Previene la ansiedad de contexto.
Playwright MCP para pruebas: Navega, hace clic, cambia el tamaño de las ventanas. Detecta errores visuales que una revisión de código nunca encontraría.
Habilidad de diseño frontend de Anthropic: Penaliza explícitamente los patrones genéricos de IA (fuente Inter, gradientes morados, diseños de tarjetas). Fomenta la toma de riesgos creativa.
Iteración continua, sin reintento tras fallo: Las 12 rondas se ejecutan independientemente. Cada una mejora.

Resultados y estadísticas

Iteración 1: funcional pero olvidable. Iteración 4: el Generador cambió a "Terminal Noir" — IBM Plex Mono, ámbar sobre negro, texturas de grano, líneas de barrido. Iteraciones 5-12: pulido, accesibilidad, correcciones responsivas, soporte de movimiento reducido.

Tiempo total: 3h 20min
Iteraciones: 12 (generador + evaluador cada una)
Código escrito manualmente: 0 líneas (algunos problemas visuales corregidos después)
Tecnología: Next.js, Tailwind, Framer Motion, TypeScript

Resultado en vivo

https://mnemo-mcp.github.io/Mnemo/

Conclusión clave

El modelo es el motor. El arnés (restricciones, bucles de retroalimentación y estructura adversarial) determina si obtienes basura de IA o algo genuinamente distintivo.

📖 Lee la fuente completa: r/ClaudeAI

Replicando el arnés generador-evaluador de Anthropic con Kiro CLI: una construcción de sitio web de 12 iteraciones

Detalles clave de la arquitectura

Resultados y estadísticas

Resultado en vivo

Conclusión clave

👀 Ver también

Experimento ALMA: Dos Meses de un Agente de IA Autónomo con $100 y Sin Instrucciones

Agente de IA recomienda cambiar de GitHub Runners a Mac Mini autohospedado

UPSC StatsBuddy Bot: Interfaz de Telegram para Datos del Gobierno Indio mediante Claude AI

El usuario de OpenClaw automatiza los pagos de estacionamiento mediante ingeniería inversa del portal gubernamental.