Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %

Ein Entwickler hat seine Erfahrungen beim Bau einer Kontext-Engine (MCP-Server) geteilt, die Claude Code einen Abhängigkeitsgraphen von Codebasen gibt, sodass es nur relevanten Code statt ganzer Dateien lesen kann. Das Tool reduziert die Token-Nutzung erheblich, indem es Abhängigkeitsgraphen und Skelette statt Rohdateien bereitstellt.
Ursprüngliches Problem und erste Lösung
Claude Code liest normalerweise ganze Dateien und gibt alles in den Kontext, was Token schnell verbraucht. Der erste Ansatz bestand darin, nur relevanten Code über MCP mit Abhängigkeitsgraphen und Skeletten statt Rohdateien zu liefern, was allein die Token-Nutzung um 65 % reduzierte.
Erkannte Ineffizienz und Lösung
Benutzer wiesen darauf hin, dass der MCP-Workflow selbst verschwenderisch war, da Agenten mehrere Roundtrips machten: get_context_capsule aufrufen, Ergebnis lesen, dann get_impact_graph aufrufen, dieses Ergebnis lesen, gefolgt von search_memory und Lesen dieses Ergebnisses. Dies erzeugte drei Roundtrips mit überlappenden Ergebnissen im Kontext.
Die run_pipeline-Korrektur
Der Entwickler lieferte ein Single-Call-MCP-Tool namens run_pipeline, das den mehrstufigen Workflow ersetzt. Das Tool erkennt automatisch die Absicht (debug/modify/refactor/explore) und führt die passende Kombination aus Kontextsuche, Impact-Analyse und Memory-Recall serverseitig aus.
run_pipeline({
task: "fix JWT validation bug",
preset: "auto",
max_tokens: 10000,
observation: "JWT uses Ed25519" // save insight in same call
})
Dieser einzelne Aufruf ersetzt 3-4 individuelle Aufrufe. Ergebnisse werden dedupliziert und innerhalb eines Token-Budgets zusammengeführt, bevor sie das Kontextfenster erreichen, was etwa 60 % weniger Kontext-Token im Vergleich zum individuellen Aufruf von Tools ergibt. Der observation-Parameter ermöglicht es Agenten, gelernte Informationen im selben Aufruf zu speichern, ohne einen separaten save_observation-Schritt. Memory ist mit Code-Graph-Knoten verknüpft, sodass bei Code-Änderungen Beobachtungen automatisch als veraltet markiert werden.
Zusätzliche veröffentlichte Funktionen
- Passive Beobachtungspipeline: Datei-Watcher → Blake3-Hash-Diff → AST-strukturelle Diffs → Auto-Korrelation mit Tool-Aufrufen → Zero-Config-Beobachtungen
- CLI, die ohne VS Code funktioniert:
npm install -g vexp-cli - Git-Hooks, die bestehende nicht überschreiben (marker-delimited blocks)
- Token-Einsparungsanzeige in der VS Code-Seitenleiste mit tatsächlichen Zahlen in einem 24-Stunden-Rolling-Fenster
Verfügbarkeit
Das Tool ist kostenlos zum Ausprobieren mit einem großzügigen Free-Tier, das 2.000 Knoten, grundlegende Pipeline-Funktionalität und vollständiges Session-Memory bietet. Kein Konto oder API-Schlüssel ist erforderlich, und es macht keine Netzwerkaufrufe. Die Kernarchitektur umfasst eine Rust-Graph-Engine und Tree-Sitter-Parser, die vom Entwickler gebaut wurden, wobei Claude Code bei der MCP-Protokollschicht, SQLite-Schema-Migrationen und Agenten-Instruktionsvorlagen assistiert.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Cowork Chrome-Erweiterung automatisiert die Entfernung persönlicher Daten von Datenmaklern
Ein Reddit-Bericht zeigt, dass die Cowork Chrome-Erweiterung in Verbindung mit einem Gmail-Konto das Ausfüllen von Formularen, das Verfassen von E-Mails und die Überprüfung von Löschungsanträgen zur Entfernung personenbezogener Daten von großen Datenanbietern in nur wenigen Stunden automatisierte.

Claude Code lädt Tool-Schemata per ToolSearch lazy, um Token zu sparen
Claude Code verschiebt das Laden von Tool-Schemata, indem nur die Tool-Namen vorab gesendet werden und ein ToolSearch-Aufruf erforderlich ist, um die Schemata vor der Nutzung zu laden. Diese Architektur reduziert den Token-Verbrauch erheblich.

AgenticStore MCP: Python-Toolkit für Claude Desktop mit 27 lokalen Tools
AgenticStore MCP ist ein Open-Source-Python-Toolkit, das mehrere MCP-Server durch eine einzige Installation ersetzt und Claude Desktop 27 lokale Tools bietet, darunter persistenter Speicher, Websuche und Repository-Überprüfung, ohne Docker- oder Node.js-Konfiguration zu erfordern.

Selbsterhaltendes Dokumentationssystem unter Verwendung von abgegrenzten Blöcken für Null-Drift
Ein Entwickler erstellte ein Bash-Skript, das strukturierte Daten direkt aus Quelldateien extrahiert und sie über eingefasste HTML-Kommentarblöcke in CLAUDE.md einfügt, wodurch die Dokumentation ohne manuelle Wartung mit dem Code synchron bleibt.