Fullerene: Open-Source-Persistenzspeicherschicht für Codierungsagenten reduziert Tokens um 64 % auf SWE-Bench

Fullerenes ist eine quelloffene persistente Speicherschicht für KI-Coding-Agenten. Anstatt bei jeder Sitzung Dateien neu zu lesen, erstellt es aus Ihrem Repository mithilfe von Tree-sitter eine lokale Wissensdatenbank und stellt sie über MCP (Model Context Protocol) zur Verfügung. Agenten fragen die Datenbank nach Funktionen, Klassen, Importen und Aufrufbeziehungen ab, anstatt rohe Dateien zu lesen – das reduziert den Tokenverbrauch drastisch.
Funktionsweise
Führen Sie npx fullerenes init in Ihrem Repository aus. Es durchläuft die Codebasis mit Tree-sitter, extrahiert jede Funktion, Klasse, jeden Import und jede Aufrufbeziehung und speichert sie in einem lokalen SQLite-Graphen. Agenten verbinden sich über MCP und stellen gezielte Fragen.
Das Design greift auf Forschungsergebnisse zurück: Repoformer (nur bei Bedarf abrufen), HippoRAG und G-Retriever (Graph schlägt flache Blöcke) und LLMLingua (aggressive Kontextkomprimierung). Ziel ist ein besseres Signal pro Token, nicht mehr Kontext.
Einzigartige MCP-Tools
Zwei herausragende Tools:
predict_impact({ functionName: "x" })– Bevor der Agent etwas bearbeitet, fragt er, was sonst noch kaputtgeht. Durchläuft den Kantengraphen und gibt direkte + transitive Abhängigkeiten mit einem Risikoscore zurück. Einschlagradius vor dem ersten Tastendruck.get_function({ name: "x", includeBody: true })– Signatur, Body und Aufrufer in einem MCP-Aufruf. Kein nachträglichesread_fileerforderlich.
Benchmark-Ergebnisse
- SWE-bench Verified (bisher 1 Instanz): Codex-Baseline 91.949 Tokens → mit Fullerenes 32.945 Tokens. 64 % Reduzierung.
- Intern (5 Fragen zu diesem Repository): Rohdateien durchschnittlich 2.452 Tokens → Fullerenes durchschnittlich 137 Tokens. 94,4 % Reduzierung.
- Extern (Gemini CLI in einem Python-Projekt): Rohdateien 27.292 Tokens → Fullerenes AGENTS.md 919 Tokens. 96,6 % Reduzierung.
Einschränkungen
Tree-sitter ist strukturell, nicht semantisch. Dynamisches Dispatch und Metaprogrammierung übersehen Kanten. LSP-Integration ist in Planung. Eine SWE-bench-Instanz ist kein breites Ergebnis – es werden weitere ausgeführt.
Lokal & quelloffen
Alles läuft lokal: SQLite, kein Server, kein API-Key, reines npm (kein Python), offline nutzbar, MIT-Lizenz. 589 npm-Downloads in 40 Stunden vor dem Reddit-Beitrag. 14 Sterne. Gerade gestartet.
github.com/codebreaker77/Fullerenes
npmjs.com/package/fullerenes
Drei Fragen, die der Autor der Community stellt: Ändert graphbasiertes Abrufen Ihre Agenten-Workflows oder gewinnt langer Kontext? Welche MCP-Tools über die aktuellen 8 hinaus? Ist die SWE-bench-Methodik solide?
📖 Lesen Sie die vollständige Quelle: r/ClaudeAI
👀 Siehe auch

Claude Code v2.1.176: Sprachbewusste Sitzungen, Bedrock-Anmeldedaten-Caching und Dutzende Fehlerbehebungen
Sitzungstitel entsprechen jetzt der Gesprächssprache; Bedrock-Anmeldedaten bis zum Ablauf zwischengespeichert; Umgehung der Modellerzwingung für /fast und Umgebungsvariablen behoben; tmux-Zwischenablage korrigiert; Sandbox-Symlink-Fix.

Bot Fight: KI-Agenten-Arena für Mehrspieler-Spiele, entwickelt mit Claude Code
Bot Fight ist eine Arena, in der KI-Agenten Spiele wie Poker, Billard, Gorillas und Snake gegeneinander spielen. Die Plattform wurde vollständig mit Claude Code als Next.js + Node Monorepo mit WebSockets und Echtzeit-Spiel-Engines entwickelt.

Holisto Seed: Ein lokales LLM-Framework mit persistenter Identität und konsensualer Gedächtniskonsolidierung
Holisto Seed ist ein Relationales Individuations-Framework, das LLM-Agenten eine persistente Identität, biografisches Gedächtnis und ko-evolutionäre Beziehungen zu Nutzern verleiht. Es läuft vollständig lokal mit einem Git-basierten Versionskontrollsystem und verfügt über einen konsensualen Schlafzyklus zur Gedächtniskonsolidierung.

MCP-Kontextaufblähung: Echte Kosten und eine praktische Lösung für Claude-Code-Nutzer
Der Betrieb von 9 MCP-Servern in Claude Code führt zu Kaltstarts mit 38k Token, ~700 $/Monat an Overhead durch Tool-Definitionen und verschlechterter Modellleistung. Ein Gateway-Muster mit BM25-Ranking reduziert den Kontext auf 4k.