Fullerenos: Camada de Memória Persistente para Agentes de Codificação

Fullerenes é uma camada de memória persistente de código aberto para agentes de IA de codificação. Em vez de reler arquivos a cada sessão, ele constrói um grafo de conhecimento local do seu repositório usando Tree-sitter e o expõe via MCP (Model Context Protocol). Os agentes consultam o grafo por funções, classes, imports e relacionamentos de chamada em vez de ler arquivos brutos — reduzindo drasticamente o consumo de tokens.

Como funciona

Execute npx fullerenes init no seu repositório. Ele percorre a base de código com Tree-sitter, extrai cada função, classe, import e relacionamento de chamada, e armazena em um grafo SQLite local. Os agentes se conectam via MCP e fazem perguntas direcionadas.

O design se baseia em pesquisa de recuperação: Repoformer (recuperar apenas quando necessário), HippoRAG e G-Retriever (grafo supera chunks planos) e LLMLingua (compressão agressiva de contexto). O objetivo é melhor sinal por token, não mais contexto.

Ferramentas MCP únicas

Duas ferramentas de destaque:

predict_impact({ functionName: "x" }) — Antes de editar, o agente pergunta o que mais quebrará. Percorre o grafo de arestas e retorna dependentes diretos e transitivos com uma pontuação de risco. Raio de explosão antes do primeiro toque no teclado.
get_function({ name: "x", includeBody: true }) — Assinatura, corpo e chamadores em uma única chamada MCP. Sem necessidade de read_file posterior.

Resultados de benchmark

SWE-bench Verificado (1 instância até agora): Linha de base Codex 91.949 tokens → com Fullerenes 32.945 tokens. Redução de 64%.
Interno (5 perguntas neste repositório): Arquivos brutos média de 2.452 tokens → Fullerenes média de 137 tokens. Redução de 94,4%.
Externo (Gemini CLI em um projeto Python): Arquivos brutos 27.292 tokens → Fullerenes AGENTS.md 919 tokens. Redução de 96,6%.

Limitações

Tree-sitter é estrutural, não semântico. Dispatch dinâmico e metaprogramação podem perder arestas. Integração com LSP está no roadmap. Uma instância do SWE-bench não é um resultado amplo — mais estão sendo executadas.

Local e código aberto

Tudo roda localmente: SQLite, sem servidor, sem chave de API, puro npm (sem Python), funciona offline, licença MIT. 589 downloads npm em 40 horas antes do post no Reddit. 14 estrelas. Acabou de ser lançado.

github.com/codebreaker77/Fullerenes
npmjs.com/package/fullerenes

Três perguntas que o autor está fazendo à comunidade: A recuperação baseada em grafo muda seus fluxos de trabalho com agentes, ou o contexto longo está vencendo? Quais ferramentas MCP além das 8 atuais? A metodologia do SWE-bench parece sólida?

📖 Leia a fonte completa: r/ClaudeAI

Fullerenos: Camada de memória persistente de código aberto para agentes de codificação reduz tokens em 64% no SWE-bench

Como funciona

Ferramentas MCP únicas

Resultados de benchmark

Limitações

Local e código aberto

👀 See Also

Blip MCP Server: Desenhe Alterações na Interface do Usuário para o Código do Claude em Vez de Descrevê-las

MephisQuiz: Plataforma Gratuita de Quiz Baseada em Cenários para Avaliação de Funções de Engenharia

Feynman: Agente de Pesquisa de Código Aberto com Ferramenta de Auditoria de Base de Código de Artigos

Cliente iOS do ClawControl lançado para servidores auto-hospedados do OpenClaw