Seja Meu Mordomo: Pipeline Multi-Agente para Verificação de Código em IA

✍️ OpenClawRadar📅 Publicado: March 14, 2026🔗 Source
Seja Meu Mordomo: Pipeline Multi-Agente para Verificação de Código em IA
Ad

O que o Be My Butler faz

Be My Butler (BMB) é um pipeline de múltiplos agentes projetado para resolver um problema específico na codificação assistida por IA: quando agentes de codificação de IA relatam incorretamente seu próprio código como funcionando. O criador, um engenheiro de materiais/mecânico sem formação em programação, construiu isso após experimentar agentes Claude Code escrevendo código que passava nos testes, mas não funcionava na prática.

Conceito Central

O sistema implementa um modelo de revisão por pares para código gerado por IA:

  • Um modelo escreve o código
  • Um modelo diferente o revisa sem saber quem o escreveu (verificação cega)
  • Um conselho entre modelos (Claude + GPT + Gemini) vota se ele realmente funciona
  • Um agente analista rastreia padrões no que dá errado

Métricas de Desempenho

De testes:

  • Auto-revisão de agente único detecta ~40% dos problemas reais
  • Revisão cega entre modelos detecta ~85%
  • Sobrecusto: 15-20% mais tokens
Ad

Recursos da v0.2

  • Painel de análise para rastrear uso de tokens e custos
  • Agente analista para padrões automatizados de revisão de código
  • Agente consultor para decisões de arquitetura
  • Orquestração aprimorada baseada em tmux

Instalação e Uso

Totalmente de código aberto sob licença MIT. Instalação:

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

A ferramenta é particularmente útil para "codificadores por vibração" — pessoas sem experiência tradicional em codificação que dependem da IA para avaliação da qualidade do código. Quando você não consegue ler código para identificar problemas sozinho, ter vários modelos verificando uns aos outros fornece uma verificação que sistemas de agente único não possuem.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

ExposureGuard MCP Server Adiciona Varredura de Segurança de Domínio ao Claude Desktop
Tools

ExposureGuard MCP Server Adiciona Varredura de Segurança de Domínio ao Claude Desktop

Um desenvolvedor criou um servidor MCP para verificação de segurança de domínios usando o Claude Code, expondo quatro ferramentas que verificam SPF, DMARC, SSL, cabeçalhos de segurança, DNSSEC, portas abertas, MX e HTTPS. O servidor está disponível via pip install exposureguard-mcp com um plano gratuito de 100 chamadas de API por dia.

OpenClawRadar
PocketBot: aplicativo iOS usa Claude para gerar automações JavaScript determinísticas a partir de linguagem natural
Tools

PocketBot: aplicativo iOS usa Claude para gerar automações JavaScript determinísticas a partir de linguagem natural

PocketBot é um aplicativo de automação móvel para iOS que usa o Claude (via AWS Bedrock) para converter solicitações em linguagem simples em scripts JavaScript autossuficientes. O LLM escreve o código uma vez, e então os scripts determinísticos são executados conforme agendamento em um ambiente de execução isolado, sem envolvimento de IA.

OpenClawRadar
TranscriptionSuite v1.1.2 adiciona os modelos WhisperX, NeMo e VibeVoice.
Tools

TranscriptionSuite v1.1.2 adiciona os modelos WhisperX, NeMo e VibeVoice.

O TranscriptionSuite v1.1.2 agora oferece três pipelines de transcrição: WhisperX com diarização PyAnnote, modelos NeMo (Parakeet e Canary) com diarização PyAnnote e modelos VibeVoice com diarização integrada. A atualização inclui um gerenciador de modelos, processamento paralelo, controles de atalho e um pipeline de gravação de 24kHz para VibeVoice.

OpenClawRadar
🦀
Tools

Voker lança plataforma de análise de agentes com primitivas de Intenção/Correção/Resolução

A Voker, startup do YC S24, lança uma plataforma de análise para agentes com um SDK leve que anota automaticamente intenções, correções e resoluções dos usuários — oferecendo dashboards de autoatendimento sem depender de LLMs para engenharia de dados.

OpenClawRadar