Agentes Subordinados no Claude: 15x Mais Tokens? Cache Dá 90% Off

Os números da Anthropic frequentemente ignorados no hype "use subagentes!": sistemas multiagente consomem cerca de 15× mais tokens que um chat único e são "menos eficazes para tarefas rigidamente interdependentes, como codificação" (fonte). No entanto, tokens em cache custam apenas 10% do normal (90% de desconto) — mas apenas se o conteúdo sinalizado para cache for idêntico entre as requisições (fonte).

Multiagente multiplica o uso de tokens por 15. O cache divide por 10. Se subagentes economizam ou queimam dinheiro depende de uma coisa: todos os subagentes compartilham o mesmo prefixo?

Três Formas de Delegar, Ordenadas por Custo

1. Subagente com subagent_type definido. Prompt de sistema personalizado, ferramentas personalizadas, permissões personalizadas (Anthropic). Prompt diferente = cache diferente. Sem compartilhamento com o pai. Preço total a cada criação. Use quando precisar de isolamento.
2. Clone que herda do pai. Sem subagent_type. Herda exatamente o prompt, ferramentas e histórico do pai. Filhos 2..N acessam o cache a 10% do preço. Cinco clones lendo arquivos em paralelo ≈ 5× velocidade a ~1,5× custo.
3. Sem subagente. Permaneça no agente principal. Mais barato por turno. Resposta certa quando o trabalho depende de si mesmo — refatorações onde o passo 2 precisa do resultado do passo 1.

Quando NÃO Delegar (a Própria Linha da Anthropic)

"Melhor para tarefas que podem ser divididas em vertentes paralelas de pesquisa." Tradução:

Bom: ler 7 arquivos em paralelo, auditar pastas por um padrão, coletar informações de várias fontes.
Ruim: refatorar um módulo, corrigir um bug onde cada etapa depende da anterior. Apenas agente principal.

Se você dividir trabalho fortemente acoplado em subagentes, paga 15× e não ganha nada.

O que Quebra o Cache

Anthropic: editar definições de ferramentas, trocar de modelos, adicionar ou remover imagens, ou alterar a estrutura anterior do prompt quebra o prefixo em cache (fonte). Então:

Instale seus MCPs no início da sessão, não no meio.
Escolha o modelo de antemão.
Não edite CLAUDE.md ou memória automática no meio da sessão — eles vivem dentro do prefixo em cache.

📖 Leia a fonte completa: r/ClaudeAI

Agentes Subordinados Paralelos no Claude Code: Quando Eles Economizam vs. Queimam Tokens

Três Formas de Delegar, Ordenadas por Custo

Quando NÃO Delegar (a Própria Linha da Anthropic)

O que Quebra o Cache

👀 See Also

Destilaria: Um Plugin de Código Claude para Contexto de Equipe Persistente

Claude Auto-Continue: Extensão do Chrome automatiza interrupções do limite de uso de ferramentas

Agente OpenClaw Adquire Capacidade de Chamadas Telefônicas por Meio de Habilidade Personalizada

Apresentando cltree: Uma TUI de Árvore de Arquivos para o Claude Code