シングルコールMCPパイプラインでClaude Codeのトークン使用量を74%削減

開発者が、Claude Codeにコードベースの依存関係グラフを提供するコンテキストエンジン（MCPサーバー）を構築した経験を共有しました。これにより、ファイル全体ではなく関連するコードのみを読み取ることが可能になりました。このツールは、生のファイルではなく依存関係グラフとスケルトンを提供することで、トークン使用量を大幅に削減します。

元の問題と初期の解決策

Claude Codeは通常、ファイル全体を読み取り、すべてをコンテキストにダンプするため、トークンを急速に消費していました。初期のアプローチでは、生のファイルではなく依存関係グラフとスケルトンをMCP経由で提供することで関連コードのみを提供し、これだけでトークン使用量を65％削減しました。

特定された非効率性と解決策

ユーザーは、MCPワークフロー自体が無駄であると指摘しました。エージェントが複数回の往復を行っていたのです：get_context_capsuleを呼び出し、結果を読み取り、次にget_impact_graphを呼び出し、その結果を読み取り、その後search_memoryを呼び出し、その結果を読み取るという流れでした。これにより、コンテキスト内で結果が重複する3回の往復が発生していました。

run_pipelineによる修正

開発者は、run_pipelineというシングルコールのMCPツールをリリースし、多段階のワークフローを置き換えました。このツールは意図（デバッグ/修正/リファクタリング/探索）を自動検出し、適切なコンテキスト検索、影響分析、メモリ呼び出しの組み合わせをサーバー側で実行します。

run_pipeline({
  task: "JWT検証バグの修正",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWTはEd25519を使用" // 同じ呼び出しで洞察を保存
})

この単一の呼び出しは、3〜4回の個別呼び出しを置き換えます。結果は重複排除され、トークン予算内で統合されてからコンテキストウィンドウに到達するため、ツールを個別に呼び出す場合と比べて約60％少ないコンテキストトークンで済みます。observationパラメータにより、エージェントは別途save_observationステップを踏むことなく、同じ呼び出しで学習した情報を保存できます。メモリはコードグラフノードにリンクされているため、コードが変更されると観察結果は自動的に古いものとしてフラグが立てられます。

追加でリリースされた機能

パッシブ観察パイプライン：ファイルウォッチャー → blake3ハッシュ差分 → ASTレベルの構造的差分 → ツール呼び出しとの自動相関 → ゼロ設定の観察
VS Codeなしで動作するCLI：npm install -g vexp-cli
既存のものを上書きしないGitフック（マーカー区切りブロック）
VS Codeサイドバーに表示されるトークン節約表示（24時間ローリングウィンドウでの実際の数値）

利用可能性

このツールは無料で試すことができ、2,000ノード、基本的なパイプライン機能、完全なセッションメモリを提供する寛大な無料ティアを提供しています。アカウントやAPIキーは不要で、ネットワーク呼び出しは一切行いません。コアアーキテクチャには、開発者が構築したRustグラフエンジンとtree-sitterパーサーが含まれており、Claude CodeはMCPプロトコル層、SQLiteスキーママイグレーション、エージェント指示テンプレートの作成を支援しています。

📖 完全なソースを読む： r/ClaudeAI