Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %

✍️ OpenClawRadar📅 Veröffentlicht: 1. März 2026🔗 Source
Einzelaufruf-MCP-Pipeline reduziert den Claude-Code-Token-Verbrauch um 74 %
Ad

Ein Entwickler hat seine Erfahrungen beim Bau einer Kontext-Engine (MCP-Server) geteilt, die Claude Code einen Abhängigkeitsgraphen von Codebasen gibt, sodass es nur relevanten Code statt ganzer Dateien lesen kann. Das Tool reduziert die Token-Nutzung erheblich, indem es Abhängigkeitsgraphen und Skelette statt Rohdateien bereitstellt.

Ursprüngliches Problem und erste Lösung

Claude Code liest normalerweise ganze Dateien und gibt alles in den Kontext, was Token schnell verbraucht. Der erste Ansatz bestand darin, nur relevanten Code über MCP mit Abhängigkeitsgraphen und Skeletten statt Rohdateien zu liefern, was allein die Token-Nutzung um 65 % reduzierte.

Erkannte Ineffizienz und Lösung

Benutzer wiesen darauf hin, dass der MCP-Workflow selbst verschwenderisch war, da Agenten mehrere Roundtrips machten: get_context_capsule aufrufen, Ergebnis lesen, dann get_impact_graph aufrufen, dieses Ergebnis lesen, gefolgt von search_memory und Lesen dieses Ergebnisses. Dies erzeugte drei Roundtrips mit überlappenden Ergebnissen im Kontext.

Die run_pipeline-Korrektur

Der Entwickler lieferte ein Single-Call-MCP-Tool namens run_pipeline, das den mehrstufigen Workflow ersetzt. Das Tool erkennt automatisch die Absicht (debug/modify/refactor/explore) und führt die passende Kombination aus Kontextsuche, Impact-Analyse und Memory-Recall serverseitig aus.

run_pipeline({
  task: "fix JWT validation bug",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT uses Ed25519" // save insight in same call
})

Dieser einzelne Aufruf ersetzt 3-4 individuelle Aufrufe. Ergebnisse werden dedupliziert und innerhalb eines Token-Budgets zusammengeführt, bevor sie das Kontextfenster erreichen, was etwa 60 % weniger Kontext-Token im Vergleich zum individuellen Aufruf von Tools ergibt. Der observation-Parameter ermöglicht es Agenten, gelernte Informationen im selben Aufruf zu speichern, ohne einen separaten save_observation-Schritt. Memory ist mit Code-Graph-Knoten verknüpft, sodass bei Code-Änderungen Beobachtungen automatisch als veraltet markiert werden.

Ad

Zusätzliche veröffentlichte Funktionen

  • Passive Beobachtungspipeline: Datei-Watcher → Blake3-Hash-Diff → AST-strukturelle Diffs → Auto-Korrelation mit Tool-Aufrufen → Zero-Config-Beobachtungen
  • CLI, die ohne VS Code funktioniert: npm install -g vexp-cli
  • Git-Hooks, die bestehende nicht überschreiben (marker-delimited blocks)
  • Token-Einsparungsanzeige in der VS Code-Seitenleiste mit tatsächlichen Zahlen in einem 24-Stunden-Rolling-Fenster

Verfügbarkeit

Das Tool ist kostenlos zum Ausprobieren mit einem großzügigen Free-Tier, das 2.000 Knoten, grundlegende Pipeline-Funktionalität und vollständiges Session-Memory bietet. Kein Konto oder API-Schlüssel ist erforderlich, und es macht keine Netzwerkaufrufe. Die Kernarchitektur umfasst eine Rust-Graph-Engine und Tree-Sitter-Parser, die vom Entwickler gebaut wurden, wobei Claude Code bei der MCP-Protokollschicht, SQLite-Schema-Migrationen und Agenten-Instruktionsvorlagen assistiert.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

WebClaw: Open-Source MCP-Server für Web-Extraktion mit Claude
Werkzeuge

WebClaw: Open-Source MCP-Server für Web-Extraktion mit Claude

WebClaw ist ein quelloffener MCP-Server, der mit Claude Code entwickelt wurde und Web-Extraktionstools für Claude Desktop und Claude Code bereitstellt. Er löst die Einschränkungen von Claudes integriertem web_fetch durch TLS-Fingerprinting und Inhaltsoptimierung.

OpenClawRadar
Spec27: Spezifikationsgesteuerte Validierung für KI-Agenten – API-Level-Tests ohne internen Zugriff
Werkzeuge

Spec27: Spezifikationsgesteuerte Validierung für KI-Agenten – API-Level-Tests ohne internen Zugriff

Spec27 ist ein neues Tool von Safe Intelligence für spezifikationsgesteuerte Validierung von KI-Agenten. Es testet das Verhalten von Agenten von außen nach innen, führt adversarielle und Robustheitsprüfungen gegen primäre Schnittstellen durch, ohne SDKs, Gateways oder interne Ablaufverfolgung zu benötigen.

OpenClawRadar
HostMyClaudeHTML: Ein-Klick-Freigabe für Claude-HTML-Artefakte
Werkzeuge

HostMyClaudeHTML: Ein-Klick-Freigabe für Claude-HTML-Artefakte

Ein Entwickler hat hostmyclaudehtml.com erstellt, ein kostenloses Tool, mit dem Sie von Claude generierte HTML-Artefakte als Live-URLs teilen können, indem Sie die .html-Datei per Drag-and-Drop hochladen. Für Uploader oder Betrachter ist kein Konto erforderlich.

OpenClawRadar
Verwenden von /probe, um KI-Halluzinationen zu erkennen, bevor Code geschrieben wird
Werkzeuge

Verwenden von /probe, um KI-Halluzinationen zu erkennen, bevor Code geschrieben wird

Ein Entwickler teilt eine Technik namens /probe, die KI-generierte Pläne dazu zwingt, nummerierte Behauptungen mit erwarteten Werten aufzustellen, und dann das reale System abfragt, um Diskrepanzen zu erkennen. Die Methode hat vier faktische Fehler in Claudes Beschreibung seines eigenen JSONL-Formats aufgedeckt, die zu Code-Fehlern geführt hätten.

OpenClawRadar