Claude Code Token-Reduktion um 74% mit Single-Call-Pipeline

Ein Entwickler hat seine Erfahrungen beim Bau einer Kontext-Engine (MCP-Server) geteilt, die Claude Code einen Abhängigkeitsgraphen von Codebasen gibt, sodass es nur relevanten Code statt ganzer Dateien lesen kann. Das Tool reduziert die Token-Nutzung erheblich, indem es Abhängigkeitsgraphen und Skelette statt Rohdateien bereitstellt.

Ursprüngliches Problem und erste Lösung

Claude Code liest normalerweise ganze Dateien und gibt alles in den Kontext, was Token schnell verbraucht. Der erste Ansatz bestand darin, nur relevanten Code über MCP mit Abhängigkeitsgraphen und Skeletten statt Rohdateien zu liefern, was allein die Token-Nutzung um 65 % reduzierte.

Erkannte Ineffizienz und Lösung

Benutzer wiesen darauf hin, dass der MCP-Workflow selbst verschwenderisch war, da Agenten mehrere Roundtrips machten: get_context_capsule aufrufen, Ergebnis lesen, dann get_impact_graph aufrufen, dieses Ergebnis lesen, gefolgt von search_memory und Lesen dieses Ergebnisses. Dies erzeugte drei Roundtrips mit überlappenden Ergebnissen im Kontext.

Die run_pipeline-Korrektur

Der Entwickler lieferte ein Single-Call-MCP-Tool namens run_pipeline, das den mehrstufigen Workflow ersetzt. Das Tool erkennt automatisch die Absicht (debug/modify/refactor/explore) und führt die passende Kombination aus Kontextsuche, Impact-Analyse und Memory-Recall serverseitig aus.

run_pipeline({
  task: "fix JWT validation bug",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT uses Ed25519" // save insight in same call
})

Dieser einzelne Aufruf ersetzt 3-4 individuelle Aufrufe. Ergebnisse werden dedupliziert und innerhalb eines Token-Budgets zusammengeführt, bevor sie das Kontextfenster erreichen, was etwa 60 % weniger Kontext-Token im Vergleich zum individuellen Aufruf von Tools ergibt. Der observation-Parameter ermöglicht es Agenten, gelernte Informationen im selben Aufruf zu speichern, ohne einen separaten save_observation-Schritt. Memory ist mit Code-Graph-Knoten verknüpft, sodass bei Code-Änderungen Beobachtungen automatisch als veraltet markiert werden.

Zusätzliche veröffentlichte Funktionen

Passive Beobachtungspipeline: Datei-Watcher → Blake3-Hash-Diff → AST-strukturelle Diffs → Auto-Korrelation mit Tool-Aufrufen → Zero-Config-Beobachtungen
CLI, die ohne VS Code funktioniert: npm install -g vexp-cli
Git-Hooks, die bestehende nicht überschreiben (marker-delimited blocks)
Token-Einsparungsanzeige in der VS Code-Seitenleiste mit tatsächlichen Zahlen in einem 24-Stunden-Rolling-Fenster

Verfügbarkeit

Das Tool ist kostenlos zum Ausprobieren mit einem großzügigen Free-Tier, das 2.000 Knoten, grundlegende Pipeline-Funktionalität und vollständiges Session-Memory bietet. Kein Konto oder API-Schlüssel ist erforderlich, und es macht keine Netzwerkaufrufe. Die Kernarchitektur umfasst eine Rust-Graph-Engine und Tree-Sitter-Parser, die vom Entwickler gebaut wurden, wobei Claude Code bei der MCP-Protokollschicht, SQLite-Schema-Migrationen und Agenten-Instruktionsvorlagen assistiert.

📖 Read the full source: r/ClaudeAI

Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %

Ursprüngliches Problem und erste Lösung

Erkannte Ineffizienz und Lösung

Die run_pipeline-Korrektur

Zusätzliche veröffentlichte Funktionen

Verfügbarkeit

👀 Siehe auch

claude-real-video: Kostenloses Tool, um Claude Videos mit Wahrnehmungsebene ansehen zu lassen

nex-life-logger: Lokaler Aktivitäts-Tracker für OpenClaw-Agenten

Lokales Dashboard für Claudes HTML-Ausgabeseiten mit Live-Neuladung

Claude Code schreibt PostHogs SQL-Parser neu: 70-fache Beschleunigung durch eigenschaftsbasiertes Testen und parallele Agenten