Seja Meu Mordomo: Pipeline Multi-Agente para Verificação de Código em IA

✍️ OpenClawRadar📅 Publicado: March 14, 2026🔗 Source

O que o Be My Butler faz

Be My Butler (BMB) é um pipeline de múltiplos agentes projetado para resolver um problema específico na codificação assistida por IA: quando agentes de codificação de IA relatam incorretamente seu próprio código como funcionando. O criador, um engenheiro de materiais/mecânico sem formação em programação, construiu isso após experimentar agentes Claude Code escrevendo código que passava nos testes, mas não funcionava na prática.

Conceito Central

O sistema implementa um modelo de revisão por pares para código gerado por IA:

Um modelo escreve o código
Um modelo diferente o revisa sem saber quem o escreveu (verificação cega)
Um conselho entre modelos (Claude + GPT + Gemini) vota se ele realmente funciona
Um agente analista rastreia padrões no que dá errado

Métricas de Desempenho

De testes:

Auto-revisão de agente único detecta ~40% dos problemas reais
Revisão cega entre modelos detecta ~85%
Sobrecusto: 15-20% mais tokens

Recursos da v0.2

Painel de análise para rastrear uso de tokens e custos
Agente analista para padrões automatizados de revisão de código
Agente consultor para decisões de arquitetura
Orquestração aprimorada baseada em tmux

Instalação e Uso

Totalmente de código aberto sob licença MIT. Instalação:

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

A ferramenta é particularmente útil para "codificadores por vibração" — pessoas sem experiência tradicional em codificação que dependem da IA para avaliação da qualidade do código. Quando você não consegue ler código para identificar problemas sozinho, ter vários modelos verificando uns aos outros fornece uma verificação que sistemas de agente único não possuem.

📖 Read the full source: r/ClaudeAI

👀 See Also

Tools

A Otimização da ANE por Meio de Experimentos de IA Direcionados por Telefone Mostra Benefícios da Fusão de Kernel

Um desenvolvedor realizou 55 experimentos de otimização no Apple Neural Engine, conduzindo o processo a partir de seu telefone usando o Claude para brainstorming. As principais melhorias incluíram a fusão de 3 kernels ANE em 1 mega-kernel, reduzindo a perda de validação de 3,75 para 2,49 e o tempo por etapa de 176ms para 96ms.

Apr 16, 2026, 04:30 PM UTC

OpenClawRadar

Tools

Recurso de Memória de Sessão Introduzido no Claude Code

Claude Code agora inclui um recurso de 'Memória de Sessão', gerando e mantendo resumos de sessão em arquivos summary.md. Desbloqueie-o com tweakcc para sessões interativas que excedam limites específicos de tokens e chamadas de ferramentas.

Feb 13, 2026, 09:45 PM UTC

OpenClawRadar

Tools

Forge: Plugin de Código Claude de Código Aberto Adiciona Portões de Governança e Testes

Forge é um plugin de código Claude de código aberto que adiciona bloqueio de arquivos, portões de teste automatizados e 22 agentes de governança para prevenir colisões e desvios em fluxos de trabalho de código gerado por IA. É licenciado sob MIT e é instalado através da loja de plugins do Claude.

Mar 19, 2026, 05:45 PM UTC

OpenClawRadar

Tools

Yozora-fm: Visualização Interativa da Galáxia de Música Anime

Yozora-fm é uma visualização interativa onde cada estrela representa uma música de abertura ou encerramento de anime, com mais de 9.000 faixas mapeadas por gênero e época. Os usuários podem clicar nas estrelas para reproduzir vídeos ou explorar a interface galáctica.

Apr 20, 2026, 04:45 AM UTC

OpenClawRadar