Servidor MCP Indexa Bases de Código em Grafo de Conhecimento para Redução de 10x em Tokens

codebase-memory-mcp é um servidor MCP que substitui a exploração de código arquivo por arquivo por consultas em grafo para assistentes de IA de programação. Ele analisa bases de código com tree-sitter em um grafo de conhecimento persistente armazenado em SQLite, contendo funções, classes, relações de chamada, rotas HTTP e links entre serviços como nós e arestas.
Principais Recursos e Especificações
- Binário único em Go sem requisitos de infraestrutura (sem Docker, sem bancos de dados, sem chaves de API)
- Suporta 35 linguagens de programação
- Desempenho de consulta em sub-milissegundos
- Sincroniza automaticamente em alterações de arquivo via polling em segundo plano
- Linguagem de consulta similar a Cypher para padrões complexos de grafo
- Licenciado sob MIT
Benchmarks de Desempenho
O servidor foi testado em 35 repositórios do mundo real, mostrando pelo menos 10x menos tokens para perguntas estruturais em comparação com a exploração tradicional arquivo por arquivo. Exemplo: Uma consulta como "o que chama ProcessOrder?" retorna uma cadeia de chamadas precisa em uma consulta de grafo (~500 tokens) em vez de ler dezenas de arquivos (~80K tokens).
Os repositórios testados variaram de 78 a 49.000 nós. O teste de estresse do kernel Linux lidou com 20.000 nós e 67.000 arestas sem timeouts.
Caso de Uso para Configurações Locais de LLM
Isso é particularmente valioso para configurações locais de LLM com janelas de contexto menores (8K-32K), onde cada token conta. O grafo retorna exatamente as informações estruturais necessárias sem despejar conteúdos inteiros de arquivos no contexto.
O servidor funciona com qualquer cliente compatível com MCP ou via modo CLI para uso direto no terminal.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Desenvolvedor monitora frustração com métrica de 'Palavrões por Mil Prompts' em 44.212 logs do Claude Code
Um desenvolvedor rastreou 'fpk' (palavrões por mil prompts) em 44.212 prompts do Claude Code ao longo de 5 meses, descobrindo que a frustração caiu 3,4× do Claude Opus 4-5 para o 4-7, e a maioria dos xingamentos tinha como alvo ferramentas ambientais, não o modelo.

OpenClaw vs Hermes: Filosofias de Design Diferentes para Agentes de IA
OpenClaw é um gateway multicanal que conecta WhatsApp, Telegram, Discord, Slack e iMessage com um enorme ecossistema de habilidades, enquanto Hermes é um agente de aprendizado que avalia tarefas, salva padrões como habilidades reutilizáveis e constrói um modelo do seu fluxo de trabalho ao longo do tempo.

DeepSeek V4 Flash Oferece Qualidade Quase-Ópus para LLMs Locais On-Premises
Usuário do Reddit relata que DeepSeek 4 Flash se aproxima do desempenho do Opus para agentes de IA locais com dados confidenciais, permitindo implantação on-premise sem AWS. Executando localmente com GPUs NVIDIA, mas ainda lento com 1M de tokens.

Desenvolvedor Cria Servidor MCP para Integração do Claude com WhatsApp, Compartilha Desafios
Um desenvolvedor criou um servidor MCP para dar ao Claude acesso a conversas reais do WhatsApp, descobrindo que o gerenciamento do contexto das conversas foi mais complicado do que o esperado e exigiu um banco de dados para rastrear as conversas.