Reduza Tokens: Roteamento Seletivo de Servidores MCP

Um post no r/ClaudeAI relata um problema sutil, porém custoso: quando vários servidores MCP estão configurados, cada prompt carrega todos eles por padrão, até mesmo consultas triviais. O usuário tinha de 5 a 6 servidores e não percebeu até verificar o uso de tokens — os prompts estavam queimando tokens ao carregar definições de servidores irrelevantes a cada vez.

Detalhes Principais

Cada prompt carregava o conjunto completo de servidores MCP (5 a 6 servidores).
Até prompts simples (ex.: "Que horas são?") acionavam todas as definições de servidores.
Solução: uma camada de roteamento personalizada que seleciona apenas os servidores relevantes para o prompt.
Resultado: o uso de tokens caiu significativamente e os tempos de resposta melhoraram.
O OP admitiu que "não acredita que deixou isso passar por tanto tempo sem verificar".

Contexto Técnico

Servidores MCP (Model Context Protocol) são ferramentas que estendem as capacidades do Claude (ex.: acesso ao sistema de arquivos, consultas a banco de dados, web scraping). O comportamento padrão em muitas configurações — incluindo clientes forkados e configs manuais — é enviar a lista completa de definições de servidores a cada mensagem. Isso significa que ferramentas para acesso a banco de dados, E/S de arquivos, navegação na web, etc., são todas despejadas no contexto antes que a entrada real do usuário seja processada.

Uma camada de roteamento pode inspecionar a mensagem do usuário (ou o prompt do sistema) e incluir condicionalmente apenas os servidores MCP cujas descrições ou ferramentas correspondam à intenção. Por exemplo, um prompt mencionando um caminho de arquivo ativaria ferramentas de arquivo; uma pergunta sobre preços de ações carregaria apenas o servidor financeiro. Isso evita a sobrecarga de tokens de metadados de servidores irrelevantes.

Para Quem é Isso

Desenvolvedores que executam Claude com múltiplos servidores MCP, especialmente em pipelines automatizados ou frontends personalizados onde a eficiência de tokens é importante.

📖 Leia a fonte completa: r/ClaudeAI

Carregar todo servidor MCP em todo prompt silenciosamente destrói o orçamento de tokens

Detalhes Principais

Contexto Técnico

Para Quem é Isso

👀 See Also

Design do Claude: 7 Dicas para Evitar Ultrapassar Seus Limites

Por que a maioria das falhas no pipeline do Claude se deve aos prompts, não aos modelos — e como corrigir com habilidades

Pare de usar Claude como um autocomplete caro — construa um sistema SDR com definições de função, arquivos de memória e rituais de refinamento

5 Comandos do Terminal do Claude Code Que Você Pode Estar Perdendo