O pipeline MCP de chamada única reduz o uso de tokens do Claude Code em 74%.

Um desenvolvedor compartilhou sua experiência construindo um motor de contexto (servidor MCP) que dá ao Claude Code um grafo de dependência de bases de código, permitindo que ele leia apenas o código relevante em vez de arquivos inteiros. A ferramenta reduz significativamente o uso de tokens ao servir grafos de dependência e esqueletos em vez de arquivos brutos.
Problema original e solução inicial
O Claude Code normalmente lê arquivos inteiros e despeja tudo no contexto, consumindo tokens rapidamente. A abordagem inicial envolvia servir apenas código relevante via MCP usando grafos de dependência e esqueletos em vez de arquivos brutos, o que por si só reduziu o uso de tokens em 65%.
Ineficiência identificada e solução
Usuários apontaram que o fluxo de trabalho do MCP em si era desperdiçador, com agentes fazendo múltiplas idas e voltas: chamando get_context_capsule, lendo o resultado, depois chamando get_impact_graph, lendo esse resultado, seguido por search_memory, e lendo esse resultado. Isso criava três idas e voltas com resultados sobrepostos no contexto.
A correção do run_pipeline
O desenvolvedor lançou uma ferramenta MCP de chamada única chamada run_pipeline que substitui o fluxo de trabalho de múltiplas etapas. A ferramenta detecta automaticamente a intenção (depurar/modificar/refatorar/explorar) e executa a combinação apropriada de busca de contexto, análise de impacto e recuperação de memória no lado do servidor.
run_pipeline({
task: "corrigir bug de validação JWT",
preset: "auto",
max_tokens: 10000,
observation: "JWT usa Ed25519" // salva insight na mesma chamada
})
Esta única chamada substitui 3-4 chamadas individuais. Os resultados são deduplicados e mesclados dentro de um orçamento de tokens antes de chegar à janela de contexto, resultando em aproximadamente 60% menos tokens de contexto em comparação com chamar ferramentas individualmente. O parâmetro observation permite que agentes salvem informações aprendidas na mesma chamada sem uma etapa separada de save_observation. A memória está vinculada a nós do grafo de código, então quando o código muda, as observações são automaticamente marcadas como desatualizadas.
Recursos adicionais lançados
- Pipeline de observação passiva: observador de arquivos → diff de hash blake3 → diffs estruturais em nível AST → autocorrelação com chamadas de ferramentas → observações de configuração zero
- CLI que funciona sem VS Code:
npm install -g vexp-cli - Ganchos do Git que não sobrescrevem os existentes (blocos delimitados por marcadores)
- Exibição de economia de tokens na barra lateral do VS Code mostrando números reais com uma janela rolante de 24 horas
Disponibilidade
A ferramenta é gratuita para experimentar com um nível gratuito generoso oferecendo 2.000 nós, funcionalidade básica de pipeline e memória completa de sessão. Nenhuma conta ou chave de API é necessária, e ela não faz nenhuma chamada de rede. A arquitetura principal inclui um motor de gráfico em Rust e analisadores tree-sitter construídos pelo desenvolvedor, com o Claude Code auxiliando na camada de protocolo MCP, migrações de esquema SQLite e modelos de instrução de agentes.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Agente OpenClaw Mantém Memória ao Mudar da Assinatura Claude para a API
Um desenvolvedor relata ter migrado com sucesso sua configuração do OpenClaw de uma assinatura do Claude para uma chave de API sem perder a memória do agente, usando a habilidade mengram-memory que salva em uma camada externa. O agente reteve ~100+ fatos aprendidos, procedimentos evoluídos e memórias episódicas.

Cull: Mecanismo de Curadoria de Conjuntos de Dados de Código Aberto para Pipelines de Imagens de IA
O Cull coleta imagens de mais de 340 fontes, incluindo Civitai, X/Twitter, Reddit, Discord e sites booru, classifica-as com um modelo de visão-linguagem via LM Studio local ou Groq, e organiza em pastas de categorias com prompts SD e registros de auditoria.

Dominando os Modos de Assinatura da Antropic: Haiku, Sonnet e Opus
Explore os modos de assinatura inovadores da Antropic—Haiku, Sonnet e Opus—projetados para aprimorar sua experiência de codificação com IA com recursos e preços personalizados.

A documentação do Claude Code inclui componentes React excessivos que inflam as contagens de tokens
Uma análise da documentação do LLM do Claude Code revela que os arquivos MDX contêm componentes React massivamente embutidos, com o arquivo context-window.md usando 18.501 tokens, mas apenas 551 tokens de conteúdo de documentação real.