Loop de Revisão Intermodelo para Agentes de Codificação de IA Detecta Falhas Críticas de Planejamento

✍️ OpenClawRadar📅 Publicado: April 16, 2026🔗 Source
Loop de Revisão Intermodelo para Agentes de Codificação de IA Detecta Falhas Críticas de Planejamento
Ad

Como Funciona a Revisão entre Modelos

Um desenvolvedor no r/ClaudeAI criou um sistema que aborda um problema comum com agentes de IA de codificação como Codex, Claude Code e Cursor: os planos são executados sem que ninguém questione suas premissas primeiro. A solução encaminha cada plano através de um segundo modelo de IA com arquitetura e dados de treinamento diferentes antes que a execução comece.

Detalhes Principais da Implementação

O modelo revisor é somente leitura e não pode tocar no código—ele só pode questionar o plano. Essa restrição é crítica porque "no momento em que pode editar, ele para de ser um crítico e começa a comprometer". O sistema executa um loop automático com um limite de rodadas: os planos voltam para revisão se problemas forem encontrados até que sejam aprovados ou atinjam o limite.

O que o Sistema Identifica

  • Planos de reversão que na verdade não revertem
  • Projetos de permissão com brechas de segurança reais
  • Portões de revisão tomando decisões de prosseguir/parar com base em estado desatualizado
  • Planos de múltiplas etapas que parecem coerentes até um segundo modelo percorrer todo o fluxo
Ad

Decisões Críticas de Design

  • Contexto de revisão delimitado impede que o revisor perca tempo lendo partes irrelevantes do repositório
  • Personas do revisor (risco de entrega, reprodutibilidade, custo de desempenho, conformidade de segurança) identificam diferentes tipos de problemas
  • Um painel TUI ao vivo mostra fase, rodada, veredito, gravidade, custo e histórico em uma única visualização de terminal
  • O sistema funciona com diferentes planejadores: Claude Code usa um gancho nativo ExitPlanMode enquanto Codex e outros orquestradores usam um portão explícito

Resultados Práticos

O desenvolvedor usou o sistema para ajudar a construí-lo: "Codex planejou, Claude revisou os planos, e o design convergiu através de múltiplas rodadas." A ferramenta é licenciada sob MIT e disponível como rival-review no GitHub.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Agentes de Codificação Paralela com tmux e Especificações em Markdown
Tools

Agentes de Codificação Paralela com tmux e Especificações em Markdown

Manuel Schipper descreve um sistema para executar 4-8 agentes de codificação paralelos usando tmux, arquivos Markdown, aliases bash e seis comandos de barra. A configuração usa especificações de Design de Funcionalidade (FD) em Markdown rastreadas através de um ciclo de vida de 8 estágios.

OpenClawRadar
Prism MCP v2.1 adiciona memória persistente às sessões do Claude
Tools

Prism MCP v2.1 adiciona memória persistente às sessões do Claude

Prism MCP v2.1.0 'O Palácio da Mente' oferece memória de sessão persistente para o Claude, eliminando a necessidade de reexplicar o contexto do projeto. Inclui armazenamento local SQLite, navegador visual de memória, reversão de estado e sincronização de contexto entre clientes.

OpenClawRadar
Painel de Silos: Interface web de código aberto para gerenciar agentes OpenClaw
Tools

Painel de Silos: Interface web de código aberto para gerenciar agentes OpenClaw

O Silos Dashboard é uma interface web com licença MIT para gerenciar agentes OpenClaw, substituindo arquivos de configuração e CLI por uma única interface. Oferece gerenciamento de agentes, chat ao vivo com streaming, instalação de habilidades, quadros de tarefas, integrações de canais e análises.

OpenClawRadar
Servidor MCP Blender com mais de 100 ferramentas construídas usando Claude Code
Tools

Servidor MCP Blender com mais de 100 ferramentas construídas usando Claude Code

Um desenvolvedor criou um servidor MCP para Blender com mais de 100 ferramentas em 14 categorias, permitindo que agentes de codificação por IA controlem a iluminação, animação, renderização e nós de geometria do Blender por meio de prompts em linguagem natural. Todo o código foi escrito usando Claude Code, que ajudou a resolver desafios arquitetônicos como o requisito de API da thread principal do Blender.

OpenClawRadar