Loop de Revisão Intermodelo para Agentes de Codificação de IA Detecta Falhas Críticas de Planejamento

Como Funciona a Revisão entre Modelos
Um desenvolvedor no r/ClaudeAI criou um sistema que aborda um problema comum com agentes de IA de codificação como Codex, Claude Code e Cursor: os planos são executados sem que ninguém questione suas premissas primeiro. A solução encaminha cada plano através de um segundo modelo de IA com arquitetura e dados de treinamento diferentes antes que a execução comece.
Detalhes Principais da Implementação
O modelo revisor é somente leitura e não pode tocar no código—ele só pode questionar o plano. Essa restrição é crítica porque "no momento em que pode editar, ele para de ser um crítico e começa a comprometer". O sistema executa um loop automático com um limite de rodadas: os planos voltam para revisão se problemas forem encontrados até que sejam aprovados ou atinjam o limite.
O que o Sistema Identifica
- Planos de reversão que na verdade não revertem
- Projetos de permissão com brechas de segurança reais
- Portões de revisão tomando decisões de prosseguir/parar com base em estado desatualizado
- Planos de múltiplas etapas que parecem coerentes até um segundo modelo percorrer todo o fluxo
Decisões Críticas de Design
- Contexto de revisão delimitado impede que o revisor perca tempo lendo partes irrelevantes do repositório
- Personas do revisor (risco de entrega, reprodutibilidade, custo de desempenho, conformidade de segurança) identificam diferentes tipos de problemas
- Um painel TUI ao vivo mostra fase, rodada, veredito, gravidade, custo e histórico em uma única visualização de terminal
- O sistema funciona com diferentes planejadores: Claude Code usa um gancho nativo ExitPlanMode enquanto Codex e outros orquestradores usam um portão explícito
Resultados Práticos
O desenvolvedor usou o sistema para ajudar a construí-lo: "Codex planejou, Claude revisou os planos, e o design convergiu através de múltiplas rodadas." A ferramenta é licenciada sob MIT e disponível como rival-review no GitHub.
📖 Read the full source: r/ClaudeAI
👀 See Also

Agentes de Codificação Paralela com tmux e Especificações em Markdown
Manuel Schipper descreve um sistema para executar 4-8 agentes de codificação paralelos usando tmux, arquivos Markdown, aliases bash e seis comandos de barra. A configuração usa especificações de Design de Funcionalidade (FD) em Markdown rastreadas através de um ciclo de vida de 8 estágios.

Prism MCP v2.1 adiciona memória persistente às sessões do Claude
Prism MCP v2.1.0 'O Palácio da Mente' oferece memória de sessão persistente para o Claude, eliminando a necessidade de reexplicar o contexto do projeto. Inclui armazenamento local SQLite, navegador visual de memória, reversão de estado e sincronização de contexto entre clientes.

Painel de Silos: Interface web de código aberto para gerenciar agentes OpenClaw
O Silos Dashboard é uma interface web com licença MIT para gerenciar agentes OpenClaw, substituindo arquivos de configuração e CLI por uma única interface. Oferece gerenciamento de agentes, chat ao vivo com streaming, instalação de habilidades, quadros de tarefas, integrações de canais e análises.

Servidor MCP Blender com mais de 100 ferramentas construídas usando Claude Code
Um desenvolvedor criou um servidor MCP para Blender com mais de 100 ferramentas em 14 categorias, permitindo que agentes de codificação por IA controlem a iluminação, animação, renderização e nós de geometria do Blender por meio de prompts em linguagem natural. Todo o código foi escrito usando Claude Code, que ajudou a resolver desafios arquitetônicos como o requisito de API da thread principal do Blender.