graphify-ts: Servidor MCP local reduz tokens de revisão de PR do Claude Code de 63K para 8,7K

Se você já usou o Claude Code em uma base de código real, viu o problema: cada pergunta desencadeia 8 a 10 chamadas sequenciais de ferramentas (glob, grep, read, read, read) para construir contexto do zero. Os tokens de entrada se acumulam, a latência arrasta e o agente redescobre a mesma estrutura a cada vez. graphify-ts é um servidor MCP gratuito e de código aberto que pré-indexa seu código em um grafo de conhecimento local, para que o Claude faça uma única chamada retrieve.
Como funciona
No momento da indexação, o graphify-ts analisa seu código com a AST do tree-sitter, extrai relações estruturais (arquivos, funções, classes, chamadas, importações), executa detecção de comunidades Louvain para agrupar módulos relacionados, indexa com BM25 e, opcionalmente, reordena com um modelo ONNX local. O grafo resultante é servido via MCP stdio — totalmente local, nenhum dado sai do seu laptop. O perfil core padrão expõe 6 ferramentas para manter a sobrecarga da sessão baixa (cerca de 5K tokens); você pode optar pela superfície completa de 21 ferramentas com GRAPHIFY_TOOL_PROFILE=full.
Benchmarks que você pode verificar
O repositório inclui um script verify.sh que deriva todos os números de evidências registradas. Resultados medidos em uma base de código real NestJS + Next.js (1.268 arquivos) com Claude Opus 4.7:
- Consulta de código única: 9 chamadas de ferramenta → 615.190 tokens de entrada → 233.508 (2,6× menos), latência de 96 seg → 35 seg (2,8× mais rápido). Ambos do campo de uso
--output-format jsondo Claude. - Revisão de PR de 36 arquivos: Tokens de prompt caíram de 63.024 para 8.690 (7,25× menor). Mesmo revisor, mesmo diff, mesma profundidade de revisão — ambas as execuções sinalizaram os mesmos pontos críticos.
- Pergunta multi-repositório em 3 repositórios: Prompt ingênuo estimado em ~1,5 milhão de tokens (não caberia em nenhuma janela) vs. 2.800 tokens com graphify-ts. O autor observa que isso é uma estimativa estrutural, não um prompt enviado.
Instalação e uso
npm install -g @mohammednagy/graphify-ts
cd seu-projeto
graphify-ts generate .
graphify-ts claude installTambém funciona com Cursor, Copilot, Gemini CLI, Aider, OpenCode via <agent> install.
Compensadores a conhecer
- Custo inicial (cold start): A primeira sessão custa cerca de 13% mais que a linha de base sem grafo devido à sobrecarga do esquema da ferramenta (~5K tokens). Sessões com múltiplas perguntas amortizam isso.
- Suporte a linguagens: A extração profunda é melhor em JS/TS com passes cientes de frameworks (Express, NestJS, Next.js, Redux Toolkit, React Router). Python/Ruby/Go/Java/Rust usam AST tree-sitter simples. C/Kotlin/C#/Scala/PHP/Swift/Zig usam um extrator estrutural genérico.
- Limitações: Este é um mapa estrutural para um agente, não um banco de dados completo de análise de programas. Rotas fortemente metaprogramadas recorrem à AST base.
O autor está ativamente buscando contraexemplos — repositórios onde a divisão estrutural falha. Licenciado sob MIT, requer Node 20+.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Contornando o Isolamento da Sandbox NemoClaw para o Agente Local Nemotron 9B
Um desenvolvedor contornou o isolamento da sandbox do NemoClaw para executar um agente totalmente local usando Nemotron 9B com chamadas de ferramentas em uma única RTX 5090. A abordagem envolveu configuração de iptables, um retransmissor TCP personalizado e tradução em tempo real de chamadas de ferramentas.

MCP-Índia-Stack: Servidor offline-first para dados financeiros indianos em agentes de IA
MCP-India-Stack é um servidor MCP offline-first que fornece funcionalidades de API financeira e governamental indiana sem autenticação ou chamadas de API externas. Ele agrupa conjuntos de dados localmente para cálculos fiscais, ferramentas de validação e consultas.

Comparação de Quatro Provedores de Hospedagem Gerenciada OpenClaw para 2026
Um desenvolvedor testou quatro provedores de hospedagem gerenciada do OpenClaw ao longo de dois meses, classificando-os com base no tempo de configuração, tempo de atividade, confiabilidade de integração, roteamento de modelos, custo e capacidade de lidar com tarefas de múltiplas etapas. O LobsterTank custa US$ 2/mês com hospedagem básica de contêineres, o KiwiClaw é US$ 39/mês com melhor suporte, o xCloud é US$ 24/mês com tempo de atividade sólido e o RunLobster é US$ 49/mês com integração extensiva de ferramentas e preço fixo.

Abordagem de Debate Multi-Agente Melhora a Qualidade do Raciocínio em LLM
Um desenvolvedor experimentou uma abordagem de debate multiagente usando o CyrcloAI, onde diferentes agentes de IA assumem papéis como analista, crítico e sintetizador para criticar as respostas uns dos outros antes de produzir uma resposta final, resultando em saídas mais estruturadas e deliberadas.