MCP de Chamada Única Reduz Tokens do Claude Code em 74%

Um desenvolvedor compartilhou sua experiência construindo um motor de contexto (servidor MCP) que dá ao Claude Code um grafo de dependência de bases de código, permitindo que ele leia apenas o código relevante em vez de arquivos inteiros. A ferramenta reduz significativamente o uso de tokens ao servir grafos de dependência e esqueletos em vez de arquivos brutos.

Problema original e solução inicial

O Claude Code normalmente lê arquivos inteiros e despeja tudo no contexto, consumindo tokens rapidamente. A abordagem inicial envolvia servir apenas código relevante via MCP usando grafos de dependência e esqueletos em vez de arquivos brutos, o que por si só reduziu o uso de tokens em 65%.

Ineficiência identificada e solução

Usuários apontaram que o fluxo de trabalho do MCP em si era desperdiçador, com agentes fazendo múltiplas idas e voltas: chamando get_context_capsule, lendo o resultado, depois chamando get_impact_graph, lendo esse resultado, seguido por search_memory, e lendo esse resultado. Isso criava três idas e voltas com resultados sobrepostos no contexto.

A correção do run_pipeline

O desenvolvedor lançou uma ferramenta MCP de chamada única chamada run_pipeline que substitui o fluxo de trabalho de múltiplas etapas. A ferramenta detecta automaticamente a intenção (depurar/modificar/refatorar/explorar) e executa a combinação apropriada de busca de contexto, análise de impacto e recuperação de memória no lado do servidor.

run_pipeline({
  task: "corrigir bug de validação JWT",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT usa Ed25519" // salva insight na mesma chamada
})

Esta única chamada substitui 3-4 chamadas individuais. Os resultados são deduplicados e mesclados dentro de um orçamento de tokens antes de chegar à janela de contexto, resultando em aproximadamente 60% menos tokens de contexto em comparação com chamar ferramentas individualmente. O parâmetro observation permite que agentes salvem informações aprendidas na mesma chamada sem uma etapa separada de save_observation. A memória está vinculada a nós do grafo de código, então quando o código muda, as observações são automaticamente marcadas como desatualizadas.

Recursos adicionais lançados

Pipeline de observação passiva: observador de arquivos → diff de hash blake3 → diffs estruturais em nível AST → autocorrelação com chamadas de ferramentas → observações de configuração zero
CLI que funciona sem VS Code: npm install -g vexp-cli
Ganchos do Git que não sobrescrevem os existentes (blocos delimitados por marcadores)
Exibição de economia de tokens na barra lateral do VS Code mostrando números reais com uma janela rolante de 24 horas

Disponibilidade

A ferramenta é gratuita para experimentar com um nível gratuito generoso oferecendo 2.000 nós, funcionalidade básica de pipeline e memória completa de sessão. Nenhuma conta ou chave de API é necessária, e ela não faz nenhuma chamada de rede. A arquitetura principal inclui um motor de gráfico em Rust e analisadores tree-sitter construídos pelo desenvolvedor, com o Claude Code auxiliando na camada de protocolo MCP, migrações de esquema SQLite e modelos de instrução de agentes.

📖 Leia a fonte completa: r/ClaudeAI