Fullerenos: Camada de memória persistente de código aberto para agentes de codificação reduz tokens em 64% no SWE-bench

✍️ OpenClawRadar📅 Publicado: April 28, 2026🔗 Source
Fullerenos: Camada de memória persistente de código aberto para agentes de codificação reduz tokens em 64% no SWE-bench
Ad

Fullerenes é uma camada de memória persistente de código aberto para agentes de IA de codificação. Em vez de reler arquivos a cada sessão, ele constrói um grafo de conhecimento local do seu repositório usando Tree-sitter e o expõe via MCP (Model Context Protocol). Os agentes consultam o grafo por funções, classes, imports e relacionamentos de chamada em vez de ler arquivos brutos — reduzindo drasticamente o consumo de tokens.

Como funciona

Execute npx fullerenes init no seu repositório. Ele percorre a base de código com Tree-sitter, extrai cada função, classe, import e relacionamento de chamada, e armazena em um grafo SQLite local. Os agentes se conectam via MCP e fazem perguntas direcionadas.

O design se baseia em pesquisa de recuperação: Repoformer (recuperar apenas quando necessário), HippoRAG e G-Retriever (grafo supera chunks planos) e LLMLingua (compressão agressiva de contexto). O objetivo é melhor sinal por token, não mais contexto.

Ferramentas MCP únicas

Duas ferramentas de destaque:

  • predict_impact({ functionName: "x" }) — Antes de editar, o agente pergunta o que mais quebrará. Percorre o grafo de arestas e retorna dependentes diretos e transitivos com uma pontuação de risco. Raio de explosão antes do primeiro toque no teclado.
  • get_function({ name: "x", includeBody: true }) — Assinatura, corpo e chamadores em uma única chamada MCP. Sem necessidade de read_file posterior.
Ad

Resultados de benchmark

  • SWE-bench Verificado (1 instância até agora): Linha de base Codex 91.949 tokens → com Fullerenes 32.945 tokens. Redução de 64%.
  • Interno (5 perguntas neste repositório): Arquivos brutos média de 2.452 tokens → Fullerenes média de 137 tokens. Redução de 94,4%.
  • Externo (Gemini CLI em um projeto Python): Arquivos brutos 27.292 tokens → Fullerenes AGENTS.md 919 tokens. Redução de 96,6%.

Limitações

Tree-sitter é estrutural, não semântico. Dispatch dinâmico e metaprogramação podem perder arestas. Integração com LSP está no roadmap. Uma instância do SWE-bench não é um resultado amplo — mais estão sendo executadas.

Local e código aberto

Tudo roda localmente: SQLite, sem servidor, sem chave de API, puro npm (sem Python), funciona offline, licença MIT. 589 downloads npm em 40 horas antes do post no Reddit. 14 estrelas. Acabou de ser lançado.

github.com/codebreaker77/Fullerenes
npmjs.com/package/fullerenes

Três perguntas que o autor está fazendo à comunidade: A recuperação baseada em grafo muda seus fluxos de trabalho com agentes, ou o contexto longo está vencendo? Quais ferramentas MCP além das 8 atuais? A metodologia do SWE-bench parece sólida?

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

O conjunto MCP de código aberto melhora a qualidade da geração de código do Claude em 15-20%.
Tools

O conjunto MCP de código aberto melhora a qualidade da geração de código do Claude em 15-20%.

Um conjunto MCP de código aberto composto por três servidores locais e uma habilidade de prompt aborda o problema do 'token ruim' na geração de código por IA, com um cliente relatando uma melhoria de 15-20% na qualidade para o Claude Code.

OpenClawRadar
Agente de IA Cria Vídeo Autonomamente Usando Remotion Sem Ferramentas Predefinidas
Tools

Agente de IA Cria Vídeo Autonomamente Usando Remotion Sem Ferramentas Predefinidas

Um desenvolvedor testou um agente de IA que criou autonomamente um vídeo curto instalando o Remotion, escrevendo código de composição, depurando problemas e entregando um arquivo renderizado sem intervenção humana.

OpenClawRadar
Codebook Lossless LLM Compression: Redução de 10-25% na RAM com Empacotamento Bitwise
Tools

Codebook Lossless LLM Compression: Redução de 10-25% na RAM com Empacotamento Bitwise

Um código de prova de conceito de um desenvolvedor demonstra a compressão sem perdas de LLMs ao empacotar pesos fp16 em blocos, alcançando redução de 10-25% na RAM com a contrapartida de aproximadamente reduzir pela metade a velocidade de inferência. A abordagem identifica que a maioria dos modelos usa apenas 12-13 bits de valores únicos, apesar da representação de 16 bits do fp16.

OpenClawRadar
OpenClaw .NET: Port para NativeAOT com Ponte JSON-RPC para Plugins Existentes
Tools

OpenClaw .NET: Port para NativeAOT com Ponte JSON-RPC para Plugins Existentes

OpenClaw .NET é uma porta em C# do OpenClaw que compila para um binário NativeAOT de ~23MB, eliminando o aquecimento do JIT e a sobrecarga do runtime Node, mantendo compatibilidade com plugins TypeScript/JavaScript existentes através de uma ponte JSON-RPC integrada.

OpenClawRadar