11 Construções Multiagente: Resultados Práticos sem Scaffolding

Principais Descobertas Técnicas de Experimentos com Sistemas Multiagentes

Análise de 11 construções de software autônomas de multiagentes sem andaimes programáticos, baseada em 295 milhões de tokens, 98 sessões de agentes e 6,1 milhões de linhas de saída dos trabalhadores, revela insights práticos para desenvolvedores que trabalham com agentes de codificação de IA.

Aplicação de Escopo e Orquestração

A aplicação de escopo é resolvida mecanicamente, não por meio de prompts: Abordagens baseadas em prompts falharam 0/20 vezes sob pressão do compilador, enquanto abordagens mecânicas (permitindo que os agentes editem tudo e usando git revert para arquivos fora do escopo) tiveram sucesso 20/20 vezes. O insight principal: não peça aos modelos para respeitar limites—aplique-os posteriormente.

Os custos do orquestrador são limitados pela memória: Aproximadamente 95% do gasto de entrada é reler o histórico da conversa. O "prêmio de estado" significa que um orquestrador de fronteira que escreve zero código entregue pode custar tanto quanto toda a frota de trabalhadores. A otimização deve visar menos turnos e menos reingestão, não raciocínio mais barato.

Dinâmicas de Coordenação e Escalonamento

Modelos não descobrem coordenação independentemente: Opus com prompt simples e acesso total a ferramentas nunca delegou, nunca escreveu especificações e nunca descobriu despacho paralelo—apenas construiu tudo sozinho. O modelo de coordenação faz o trabalho real.

A profundidade escala de forma diferente da qualidade: Despacho plano supera a hierarquia em ≤10 domínios em produtividade, eficiência de tokens e tempo de execução. Acima de 10 domínios, a hierarquia permite paralelismo que o despacho plano não consegue alcançar.

Solo supera a coordenação até que os limites de contexto se liguem: A produtividade solo é aproximadamente 325 LOC/min e invariável ao tamanho do projeto. A produtividade da pirâmide escala com os trabalhadores. Abaixo de ~30K LOC, a delegação é pura sobrecarga.

Desempenho do Trabalhador e Sistemas de Tipos

A capacidade do modelo do trabalhador impulsiona a produtividade: Mesma arquitetura, mesma especificação, três modelos de trabalhador produziram: 17.761 LOC vs 6.001 vs 1.818—uma lacuna de 9,8x. A arquitetura permite produtividade paralela; o modelo do trabalhador a determina.

Contratos de tipo fornecem vocabulário compartilhado: A integração tem sucesso sem contratos em todas as escalas testadas (6–36 módulos), mesmo sob restrições de somente leitura. Mas sem contratos, trabalhadores paralelos produzem silenciosamente tipos estruturalmente incompatíveis que compilam apenas porque nada faz referência cruzada. Um único contrato de 984 linhas escrito às cegas foi mantido em 10 domínios independentes.

Contratos de tipo eliminam sobrecarga de coordenação em escala: Teste de escalonamento controlado (1–20 trabalhadores, especificação fixa) mostrou zero erros de integração em 50 construções de domínio. Ponto ideal em 10 trabalhadores: aceleração de tempo de execução de 2,05x. Em 20 trabalhadores, dependências de fase serial anulam os ganhos de paralelismo (fração serial de Amdahl ~44%).

Padrões de Contexto e Delegação

A preparação de contexto funciona; o formato não importa: 0% de transferência de fórmula a frio, 100% com contexto de design presente (N=10 por condição). Um documento de referência estático produz taxas de transferência idênticas a uma conversa de inicialização sintética.

A compressão de delegação é inerente: Cada camada de delegação atua como um resumidor com perdas. Requisitos quantitativos ("80 armas") desaparecem; requisitos estruturais (interfaces de tipo) sobrevivem. Correção: os trabalhadores devem ler especificações completas do sistema de arquivos em vez de depender de cadeias de prompts comprimidas.

A recuperação de compactação é robusta com bons resumos: Zero recaída de tarefa em 11 eventos de compactação. O modelo declara o estado esperado e depois lê o disco para verificar.

Modos de Falha e Correções

Reflexo de abstração: Constrói um orquestrador em vez de orquestrar—nomeie-o no prompt
Erro de auto-modelo: Alega capacidades falsas—documente as ferramentas disponíveis explicitamente
Paradoxo de identidade: Não consegue manter papéis duplos—use instâncias de modelo separadas
Compressão de delegação: Use especificações enumerativas mais acesso ao sistema de arquivos

📖 Leia a fonte completa: r/ClaudeAI