KI-basierte Codierungssitzungskosten mit grafischer Code-Indizierung um 90 % senken

Ein Reddit-Nutzer berichtet, dass er für jede Abfrage bei Claude Code 2–6 Dollar ausgibt, da das Modell in jeder Sitzung Dutzende von Dateien neu liest. Selbst mit Caching (70 % der Tokens aus dem Cache mit 90 % Rabatt) wird der Cache pro Sitzung zurückgesetzt. Die Lösung: Ein lokaler Server, der die Codebasis in einer Graphdatenbank indiziert und über das Model Context Protocol (MCP) abgefragt wird – anstatt rohe Dateien zu lesen.
Wie es funktioniert
- Anstatt AST-Parsing oder Vektor-Embeddings zu verwenden, nutzt das Tool ein LLM, um einen Zweck, eine Zusammenfassung und einen geschäftlichen Kontext für jede Datei zu generieren, sowie Links zu deren Funktionen, Klassen und Imports.
- Der Graph wird über einen MCP-Server bereitgestellt; Claude fragt den Graphen nach gezielten Informationen ab (2–4 Knoten pro Frage), anstatt das gesamte Repository in den Kontext zu laden.
- Die Sitzungskosten sanken von Dollar- auf Centbeträge. Der Ansatz funktioniert ebenso gut mit Open-Source-Modellen wie DeepSeek-V4 und Kimi-2.6, da der Abruf (nicht die Modellgröße) die Hauptarbeit leistet.
Einrichtungsdetails
Alles läuft lokal, Single-Tenant, ohne Cloud-Abhängigkeit. Das Projekt ist auf GitHub als Open Source verfügbar: github.com/ByteBell/bytebell-oss. Der Nutzer merkt an, dass sie kein AST-Parsing oder Vektoren verwenden – der Graph basiert auf LLM-generierten Dateianalysen.
Für wen das geeignet ist
Entwickler, die Claude Code (oder einen anderen tokenkostenintensiven KI-Agenten) in großen Codebasen einsetzen und Kosten senken möchten, indem sie strukturellen Kontext über Sitzungen hinweg zwischenspeichern.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Claude Ops: Browser-Dashboard für Claude Code Live-Status und Subagenten-Tracking
Ein kostenloses, lokales macOS-Browser-Dashboard, das den Live-Status von Claude Code-Sitzungen, das aktuelle Tool, gestartete Subagents anzeigt und OS-Push-Benachrichtigungen sendet, wenn eine Eingabe erforderlich ist.

Sherlock: Apple-Entwicklerdokumentation als lokales MCP für Claude Code
Sherlock indexiert 70.000 Apple API-Symbole in SQLite FTS5 und stellt 5 MCP-Tools sowie 3 automatisch auslösende Fähigkeiten bereit, um Claude Code in echten Dokumentationen zu verankern und Halluzinationen zu vermeiden.

Hawkeye-Update fügt Schwarm-Orchestrierung, Remote-Aufgaben und lokale Modellunterstützung hinzu
Hawkeye v1.0+ unterstützt jetzt Multi-Agenten-Schwarm-Orchestrierung, Remote-Aufgabenwarteschlangen und verbesserte Ollama/LM Studio-Integration. Der lokale First-AI-Agent-Flugschreiber hilft Entwicklern, nachzuvollziehen, was passiert, wenn Agenten in Repositories arbeiten.

Fünf OpenClaw-Plugins, die zentrale Produktionsprobleme lösen
Ein Reddit-Nutzer identifiziert fünf OpenClaw-Plugins, die häufige Produktionsprobleme lösen: Manifest für Modell-Routing, Composio für Integrationsmanagement, Hyperspell für Speicher, Foundry für Workflow-Automatisierung und Opik für Tracing.