KI-basierte Codierungssitzungskosten mit grafischer Code-Indizierung um 90 % senken

✍️ OpenClawRadar📅 Veröffentlicht: 10. Mai 2026🔗 Source
KI-basierte Codierungssitzungskosten mit grafischer Code-Indizierung um 90 % senken
Ad

Ein Reddit-Nutzer berichtet, dass er für jede Abfrage bei Claude Code 2–6 Dollar ausgibt, da das Modell in jeder Sitzung Dutzende von Dateien neu liest. Selbst mit Caching (70 % der Tokens aus dem Cache mit 90 % Rabatt) wird der Cache pro Sitzung zurückgesetzt. Die Lösung: Ein lokaler Server, der die Codebasis in einer Graphdatenbank indiziert und über das Model Context Protocol (MCP) abgefragt wird – anstatt rohe Dateien zu lesen.

Wie es funktioniert

  • Anstatt AST-Parsing oder Vektor-Embeddings zu verwenden, nutzt das Tool ein LLM, um einen Zweck, eine Zusammenfassung und einen geschäftlichen Kontext für jede Datei zu generieren, sowie Links zu deren Funktionen, Klassen und Imports.
  • Der Graph wird über einen MCP-Server bereitgestellt; Claude fragt den Graphen nach gezielten Informationen ab (2–4 Knoten pro Frage), anstatt das gesamte Repository in den Kontext zu laden.
  • Die Sitzungskosten sanken von Dollar- auf Centbeträge. Der Ansatz funktioniert ebenso gut mit Open-Source-Modellen wie DeepSeek-V4 und Kimi-2.6, da der Abruf (nicht die Modellgröße) die Hauptarbeit leistet.
Ad

Einrichtungsdetails

Alles läuft lokal, Single-Tenant, ohne Cloud-Abhängigkeit. Das Projekt ist auf GitHub als Open Source verfügbar: github.com/ByteBell/bytebell-oss. Der Nutzer merkt an, dass sie kein AST-Parsing oder Vektoren verwenden – der Graph basiert auf LLM-generierten Dateianalysen.

Für wen das geeignet ist

Entwickler, die Claude Code (oder einen anderen tokenkostenintensiven KI-Agenten) in großen Codebasen einsetzen und Kosten senken möchten, indem sie strukturellen Kontext über Sitzungen hinweg zwischenspeichern.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch