Kiro CLI: Como Clonar o Harness Gerador-Avaliador da Anthropic em 12 Iterações

Um desenvolvedor replicou o design do harness Generator-Avaliador da Anthropic para aplicativos de longa duração, inspirado em GANs. A arquitetura: um Planejador (executado uma vez) e depois um loop Generator ↔ Avaliador por 12 iterações. Cada agente é um processo CLI separado com contexto compartilhado zero, comunicando-se apenas por meio de arquivos (spec.md, eval-report.md). O Avaliador usa Playwright para navegar no site ao vivo — não apenas ler o código.

Detalhes Principais da Arquitetura

Página limpa por invocação: Cada agente começa do zero, lê apenas seus arquivos de entrada. Previne ansiedade de contexto.
Playwright MCP para teste: Navega, clica, redimensiona viewports. Captura bugs visuais que a revisão de código nunca pegaria.
Habilidade de design frontend da Anthropic: Penaliza explicitamente padrões genéricos de IA (fonte Inter, gradientes roxos, layouts de cartão). Força a tomada de riscos criativa.
Iteração contínua, não repetir em caso de falha: Todas as 12 rodadas são executadas independentemente. Cada uma melhora.

Resultados e Estatísticas

Iteração 1: funcional, mas esquecível. Iteração 4: O Generator mudou para "Terminal Noir" — IBM Plex Mono, âmbar sobre preto, texturas de grão, scanlines. Iterações 5-12: polimento, acessibilidade, correções responsivas, suporte a movimento reduzido.

Tempo total: 3h 20min
Iterações: 12 (generator + avaliador cada)
Linhas de código escritas manualmente: 0 (alguns problemas visuais corrigidos depois)
Tecnologias: Next.js, Tailwind, Framer Motion, TypeScript

Resultado ao Vivo

https://mnemo-mcp.github.io/Mnemo/

Principal Conclusão

O modelo é o motor. O harness — restrições, loops de feedback e estrutura adversarial — determina se você obtém porcaria de IA ou algo genuinamente distinto.

📖 Leia a fonte completa: r/ClaudeAI

Clonando o harness gerador-avaliador da Anthropic com Kiro CLI: Construção de site em 12 iterações

Detalhes Principais da Arquitetura

Resultados e Estatísticas

Resultado ao Vivo

Principal Conclusão

👀 See Also

Agente de IA de autodesenvolvimento estagnou devido à inchação de processos, corrigido cortando 60% da configuração

Programa de Parceiros Claude: Consultoria de Duas Pessoas Atende Requisito de Dez com Profissionais Independentes Certificados

Reduzindo a Inflação de Contexto de Agentes de IA com Arquitetura de Espaço Único

Desacoplar a Narrativa do Rastreamento de Estado Corrige a Amnésia de Aventuras de Texto de IA