Loop de Revisão Intermodelo Detecta Falhas em Agentes de IA

Como Funciona a Revisão entre Modelos

Um desenvolvedor no r/ClaudeAI criou um sistema que aborda um problema comum com agentes de IA de codificação como Codex, Claude Code e Cursor: os planos são executados sem que ninguém questione suas premissas primeiro. A solução encaminha cada plano através de um segundo modelo de IA com arquitetura e dados de treinamento diferentes antes que a execução comece.

Detalhes Principais da Implementação

O modelo revisor é somente leitura e não pode tocar no código—ele só pode questionar o plano. Essa restrição é crítica porque "no momento em que pode editar, ele para de ser um crítico e começa a comprometer". O sistema executa um loop automático com um limite de rodadas: os planos voltam para revisão se problemas forem encontrados até que sejam aprovados ou atinjam o limite.

O que o Sistema Identifica

Planos de reversão que na verdade não revertem
Projetos de permissão com brechas de segurança reais
Portões de revisão tomando decisões de prosseguir/parar com base em estado desatualizado
Planos de múltiplas etapas que parecem coerentes até um segundo modelo percorrer todo o fluxo

Decisões Críticas de Design

Contexto de revisão delimitado impede que o revisor perca tempo lendo partes irrelevantes do repositório
Personas do revisor (risco de entrega, reprodutibilidade, custo de desempenho, conformidade de segurança) identificam diferentes tipos de problemas
Um painel TUI ao vivo mostra fase, rodada, veredito, gravidade, custo e histórico em uma única visualização de terminal
O sistema funciona com diferentes planejadores: Claude Code usa um gancho nativo ExitPlanMode enquanto Codex e outros orquestradores usam um portão explícito

Resultados Práticos

O desenvolvedor usou o sistema para ajudar a construí-lo: "Codex planejou, Claude revisou os planos, e o design convergiu através de múltiplas rodadas." A ferramenta é licenciada sob MIT e disponível como rival-review no GitHub.

📖 Read the full source: r/ClaudeAI

Loop de Revisão Intermodelo para Agentes de Codificação de IA Detecta Falhas Críticas de Planejamento

Como Funciona a Revisão entre Modelos

Detalhes Principais da Implementação

O que o Sistema Identifica

Decisões Críticas de Design

Resultados Práticos

👀 See Also

Google Lança Sashiko: Agente de Revisão de Código com IA para Patches do Kernel Linux

OnUI: Extensão de Navegador para Feedback Preciso de Interface ao Claude Code

Claude Skills Hub: Repositório Pesquisável com 789+ Habilidades de Código Claude e 10 Agentes Autônomos

Heartbeat-gateway: Substituição orientada a eventos para a sondagem cron no OpenClaw