Fullerene: Open-Source-Persistenzspeicher reduziert Tokens um 64%

Fullerenes ist eine quelloffene persistente Speicherschicht für KI-Coding-Agenten. Anstatt bei jeder Sitzung Dateien neu zu lesen, erstellt es aus Ihrem Repository mithilfe von Tree-sitter eine lokale Wissensdatenbank und stellt sie über MCP (Model Context Protocol) zur Verfügung. Agenten fragen die Datenbank nach Funktionen, Klassen, Importen und Aufrufbeziehungen ab, anstatt rohe Dateien zu lesen – das reduziert den Tokenverbrauch drastisch.

Funktionsweise

Führen Sie npx fullerenes init in Ihrem Repository aus. Es durchläuft die Codebasis mit Tree-sitter, extrahiert jede Funktion, Klasse, jeden Import und jede Aufrufbeziehung und speichert sie in einem lokalen SQLite-Graphen. Agenten verbinden sich über MCP und stellen gezielte Fragen.

Das Design greift auf Forschungsergebnisse zurück: Repoformer (nur bei Bedarf abrufen), HippoRAG und G-Retriever (Graph schlägt flache Blöcke) und LLMLingua (aggressive Kontextkomprimierung). Ziel ist ein besseres Signal pro Token, nicht mehr Kontext.

Einzigartige MCP-Tools

Zwei herausragende Tools:

predict_impact({ functionName: "x" }) – Bevor der Agent etwas bearbeitet, fragt er, was sonst noch kaputtgeht. Durchläuft den Kantengraphen und gibt direkte + transitive Abhängigkeiten mit einem Risikoscore zurück. Einschlagradius vor dem ersten Tastendruck.
get_function({ name: "x", includeBody: true }) – Signatur, Body und Aufrufer in einem MCP-Aufruf. Kein nachträgliches read_file erforderlich.

Benchmark-Ergebnisse

SWE-bench Verified (bisher 1 Instanz): Codex-Baseline 91.949 Tokens → mit Fullerenes 32.945 Tokens. 64 % Reduzierung.
Intern (5 Fragen zu diesem Repository): Rohdateien durchschnittlich 2.452 Tokens → Fullerenes durchschnittlich 137 Tokens. 94,4 % Reduzierung.
Extern (Gemini CLI in einem Python-Projekt): Rohdateien 27.292 Tokens → Fullerenes AGENTS.md 919 Tokens. 96,6 % Reduzierung.

Einschränkungen

Tree-sitter ist strukturell, nicht semantisch. Dynamisches Dispatch und Metaprogrammierung übersehen Kanten. LSP-Integration ist in Planung. Eine SWE-bench-Instanz ist kein breites Ergebnis – es werden weitere ausgeführt.

Lokal & quelloffen

Alles läuft lokal: SQLite, kein Server, kein API-Key, reines npm (kein Python), offline nutzbar, MIT-Lizenz. 589 npm-Downloads in 40 Stunden vor dem Reddit-Beitrag. 14 Sterne. Gerade gestartet.

github.com/codebreaker77/Fullerenes
npmjs.com/package/fullerenes

Drei Fragen, die der Autor der Community stellt: Ändert graphbasiertes Abrufen Ihre Agenten-Workflows oder gewinnt langer Kontext? Welche MCP-Tools über die aktuellen 8 hinaus? Ist die SWE-bench-Methodik solide?

📖 Lesen Sie die vollständige Quelle: r/ClaudeAI

Fullerene: Open-Source-Persistenzspeicherschicht für Codierungsagenten reduziert Tokens um 64 % auf SWE-Bench

Funktionsweise

Einzigartige MCP-Tools

Benchmark-Ergebnisse

Einschränkungen

Lokal & quelloffen

👀 Siehe auch

Claude Code v2.1.176: Sprachbewusste Sitzungen, Bedrock-Anmeldedaten-Caching und Dutzende Fehlerbehebungen

Bot Fight: KI-Agenten-Arena für Mehrspieler-Spiele, entwickelt mit Claude Code

Holisto Seed: Ein lokales LLM-Framework mit persistenter Identität und konsensualer Gedächtniskonsolidierung

MCP-Kontextaufblähung: Echte Kosten und eine praktische Lösung für Claude-Code-Nutzer