Projeto de Sistema Multiagente da Anthropic para Melhorar a Qualidade do Código do Claude

✍️ OpenClawRadar📅 Publicado: March 29, 2026🔗 Source

A Anthropic publicou uma postagem de blog delineando uma abordagem de design de arnês para melhorar o desempenho do Claude em tarefas de codificação de longa duração. O método aborda dois problemas específicos: ansiedade de contexto (perda de coerência ao longo de períodos estendidos) e viés de autoavaliação (Claude elogiando seu próprio trabalho mesmo quando a qualidade é ruim).

Solução Multiagente

A solução implementa múltiplos agentes trabalhando juntos, inspirando-se em GANs (Redes Adversariais Generativas). A estrutura central envolve:

Gerador: Cria código e design
Avaliador: Fornece avaliação crítica e feedback

Implementação Frontend

Para desenvolvimento frontend, o arnês usa 4 critérios de pontuação que enfatizam estética e criatividade para evitar designs genéricos. O processo envolve 5 a 15 revisões, resultando em saídas mais bonitas e únicas.

Implementação Full-Stack

Para desenvolvimento full-stack, o arnês emprega 3 agentes:

Planejador
Gerador
Avaliador

Comparação de Desempenho

O artigo compara resultados para os mesmos requisitos de desenvolvimento de jogo:

Executando sozinho: Execução rápida, mas o jogo tem bugs graves
Usando um arnês: Mais demorado e caro, mas produz resultados significativamente de maior qualidade, incluindo interface bonita, jogo jogável e suporte de IA adicionado

O artigo sugere que, à medida que os modelos se tornam mais poderosos (mencionando especificamente o Opus 4.6), elementos desnecessários do arnês devem ser removidos.

📖 Read the full source: r/ClaudeAI

👀 See Also

Tools

Resultados de Benchmark: CLI do GitHub vs Abordagens MCP para Agentes de IA

Um benchmark independente comparou GitHub CLI, MCP, MCP com Busca de Ferramentas e MCP com Modo Código para tarefas de agentes de IA. GitHub CLI foi o mais custo-efetivo, enquanto as abordagens MCP mostraram compensações em custo, latência e modos de falha.

Mar 28, 2026, 08:45 PM UTC

OpenClawRadar

Tools

Servidor MCP para Projetos TypeScript Substitui o Padrão Grep do Claude Code por Consultas Indexadas de Símbolos

Um desenvolvedor criou um servidor MCP que substitui o padrão de grep-e-adivinhação do Claude Code por buscas indexadas de símbolos para projetos TypeScript. A ferramenta mantém um índice SQLite em tempo real de símbolos, locais de chamada, importações e hierarquia de classes, reduzindo o uso de tokens em 63-79% em testes.

Apr 17, 2026, 09:08 AM UTC

OpenClawRadar

Tools

Discussão no Reddit: Arquivos Identity.md são insuficientes para estabilidade de personalidade de funcionários de IA sem uma arquitetura de modelo adequada

Uma discussão no Reddit argumenta que ajustar arquivos identity.md para evitar vazamento de personalidade em equipes de funcionários de IA é ineficaz se a arquitetura do modelo subjacente apenas simula a separação de papéis. A postagem recomenda usar o backend Minimax M2.7, que incorporou a consciência de limites no treinamento base por meio de mais de 100 ciclos de auto-evolução.

Apr 6, 2026, 06:45 PM UTC

OpenClawRadar

Tools

NervMap: Ferramenta de Descoberta de Serviços e Diagnóstico de Servidor com Comando Único

NervMap é uma ferramenta Linux que descobre contêineres Docker, serviços systemd e processos diretos em menos de 1 segundo, mapeia dependências entre eles e diagnostica problemas com análise de severidade e sugestões de correção.

Mar 22, 2026, 05:45 AM UTC

OpenClawRadar