シングルコールMCPパイプラインにより、Claude Codeのトークン使用量を74%削減

✍️ OpenClawRadar📅 公開日: March 1, 2026🔗 Source
シングルコールMCPパイプラインにより、Claude Codeのトークン使用量を74%削減
Ad

開発者が、Claude Codeにコードベースの依存関係グラフを提供するコンテキストエンジン(MCPサーバー)を構築した経験を共有しました。これにより、ファイル全体ではなく関連するコードのみを読み取ることが可能になりました。このツールは、生のファイルではなく依存関係グラフとスケルトンを提供することで、トークン使用量を大幅に削減します。

元の問題と初期の解決策

Claude Codeは通常、ファイル全体を読み取り、すべてをコンテキストにダンプするため、トークンを急速に消費していました。初期のアプローチでは、生のファイルではなく依存関係グラフとスケルトンをMCP経由で提供することで関連コードのみを提供し、これだけでトークン使用量を65%削減しました。

特定された非効率性と解決策

ユーザーは、MCPワークフロー自体が無駄であると指摘しました。エージェントが複数回の往復を行っていたのです:get_context_capsuleを呼び出し、結果を読み取り、次にget_impact_graphを呼び出し、その結果を読み取り、その後search_memoryを呼び出し、その結果を読み取るという流れでした。これにより、コンテキスト内で結果が重複する3回の往復が発生していました。

run_pipelineによる修正

開発者は、run_pipelineというシングルコールのMCPツールをリリースし、多段階のワークフローを置き換えました。このツールは意図(デバッグ/修正/リファクタリング/探索)を自動検出し、適切なコンテキスト検索、影響分析、メモリ呼び出しの組み合わせをサーバー側で実行します。

run_pipeline({
  task: "JWT検証バグの修正",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWTはEd25519を使用" // 同じ呼び出しで洞察を保存
})

この単一の呼び出しは、3〜4回の個別呼び出しを置き換えます。結果は重複排除され、トークン予算内で統合されてからコンテキストウィンドウに到達するため、ツールを個別に呼び出す場合と比べて約60%少ないコンテキストトークンで済みます。observationパラメータにより、エージェントは別途save_observationステップを踏むことなく、同じ呼び出しで学習した情報を保存できます。メモリはコードグラフノードにリンクされているため、コードが変更されると観察結果は自動的に古いものとしてフラグが立てられます。

Ad

追加でリリースされた機能

  • パッシブ観察パイプライン:ファイルウォッチャー → blake3ハッシュ差分 → ASTレベルの構造的差分 → ツール呼び出しとの自動相関 → ゼロ設定の観察
  • VS Codeなしで動作するCLI:npm install -g vexp-cli
  • 既存のものを上書きしないGitフック(マーカー区切りブロック)
  • VS Codeサイドバーに表示されるトークン節約表示(24時間ローリングウィンドウでの実際の数値)

利用可能性

このツールは無料で試すことができ、2,000ノード、基本的なパイプライン機能、完全なセッションメモリを提供する寛大な無料ティアを提供しています。アカウントやAPIキーは不要で、ネットワーク呼び出しは一切行いません。コアアーキテクチャには、開発者が構築したRustグラフエンジンとtree-sitterパーサーが含まれており、Claude CodeはMCPプロトコル層、SQLiteスキーママイグレーション、エージェント指示テンプレートの作成を支援しています。

📖 完全なソースを読む: r/ClaudeAI

Ad

👀 See Also

パイロットコンソール:プライベートAIエージェントネットワーク管理用ウェブダッシュボード
Tools

パイロットコンソール:プライベートAIエージェントネットワーク管理用ウェブダッシュボード

ある開発者が、Pilot Protocolを基盤とするP2Pネットワーク層を使用して、プライベートAIエージェントネットワークを管理するためのウェブダッシュボード「Pilot Console」を構築しました。開発者はClaudeを活用してバックエンドAPIのルーティングを生成し、Reactダッシュボードの構造を設計することで、開発を加速させました。

OpenClawRadar
メルリン:ローカルファーストのLLMコンテキスト重複除去 – 最大71%のチャンク重複を測定、フリー&オープンコア
Tools

メルリン:ローカルファーストのLLMコンテキスト重複除去 – 最大71%のチャンク重複を測定、フリー&オープンコア

Merlinは、実際のエージェント/RAGセッションからの2200万パッセージにおいて22〜71%のチャンク重複を測定した、ローカルファーストのコンテキスト重複除去ツールです。HTTPプロキシ(Ollama/vLLM/SGLang/llama.cpp)、MCPサーバー(Claude/Cursor/OpenClaw)、またはスタンドアロンCLIとして提供されます。MITオープンコアで、毎日の使用上限があります。

OpenClawRadar
クロード・コードをドリフトなしで夜間の無人セッションで実行するためのパターン
Tools

クロード・コードをドリフトなしで夜間の無人セッションで実行するためのパターン

3つの要素—チェーンランナー、スーパーバイザー、そして単一のハンドオフ契約—が、数時間にわたる自律型Claude Codeセッションにおけるフィードバックループのドリフト問題を解決します。

OpenClawRadar
DiscordオートコンプリートのためのQwen 14Bのファインチューニング
Tools

DiscordオートコンプリートのためのQwen 14Bのファインチューニング

ある開発者が、Discordメッセージデータセットを使用してQwen 14Bモデルを微調整し、オートコンプリートツールを作成した経験を共有しました。

OpenClawRadar