Claude Code MCPスタックの測定:キャッシュ親和性とバイト節約の比較、およびプロンプトキャッシュの2行修正

Claude CodeのMCPスタックを最適化する際、1つの指標(バイト節約量)に集中しがちです。しかし、Greg Shevchenkoの新しい分析は、単一軸のベンチマークでは本番環境で厳密に悪いシステムを推奨する可能性があることを示しています。見落とされていた軸は、キャッシュ親和性、つまり同じ入力が実行間でバイト単位で同一の出力を生成し、Anthropicのプロンプトキャッシュがヒットするかどうかです。
Shevchenkoが最もバイトを節約したシステム(コンテキストを60~70%削減する検索MCP)は、実は毎回の呼び出しで5分間のTTLプロンプトキャッシュを無効化していました。同じクエリの2回の実行で異なるバイトが生成されたのは、rg --files-with-matchesの出力順序がMapへの挿入順序を通じて最終的なコンテキストに漏れたためです。修正は2行:スライス前にrgのヒットをソートし、Mapのエントリをパスでソート。変更後、バイト節約量は変わらず、cache_friendly_scoreは約0%から100%になりました。
ハーネスが測定するもの
Shevchenkoはオープンソースのベンチマークハーネス(stdlibのみのPython、オフライン)を公開し、以下を測定します。
- 平均比率 + CV:フィクスチャあたりN≧5回の実行で、バイト節約軸
- ユニークMD5カウント == 1チェック:キャッシュ親和性軸(0~100%)
- 12のアンチパターン監査:ツール定義における(DSA参照)
任意の圧縮機を(str) -> strとしてプラグイン可能。ハーネスはクラスタブートストラップCI、Wilson CI、事前登録、実データのCohen's κを使用。
調査された公開代替手段
Shevchenkoは公開ドキュメントを調査:Cursorコードベースインデックス、Sourcegraph Cody、Aider repo-map、Microsoft LLMLingua/LLMLingua-2、Firecrawl/Jina Reader、RouteLLM/Martian(2026年5月時点)。キャッシュ親和性の指標を開示したものはありませんでした。
制限
彼は準備レイヤーが後続のターンでより多くのダウンストリームキャッシュヒットを引き起こすと仮説を立てましたが、有意には達しませんでした(Welch p=0.32、Cohen's d≈0.18、N=137)。コーパス上の2判定者Cohen's κは0.5955(中程度、0.7未満)、5つの不一致のうち4つは曖昧なタスクによるもので、仕様を修正すればκは約0.83に上昇します。
ハーネスはMITライセンスです。Claude Code MCPスタックを実行しているなら、cache_friendly_scoreの測定は具体的で実行可能なステップです。
📖 全文ソース: r/ClaudeAI
👀 See Also

Discord経由でDockerスクリプトを使用したヘッドレスOpenClawセットアップ
GitHubリポジトリでは、TUI/WebUIを回避し、ヘッドレスDockerコンテナ内でOpenClawをDiscordと連携して実行するスクリプトを提供しています。これには、claw init、start、stopなどのコマンドを備えた管理スクリプト、OpenAI Responses API、Chromium、および各種ツールの事前設定済みサポートが含まれています。

Nudge: コンテキストトリガーを通じてClaude生成の計画を表示するローカルファーストアプリ
Nudgeは、Claude、ChatGPT、Notesなどからマークダウン形式の計画を貼り付け、時間、場所、Wi-Fi、非アクティブ、または一回限りのトリガーを設定して、ローカル通知で表示できる無料のiOS/Androidアプリです。データはすべて端末内に保存され、アカウントやサーバーは不要です。

BigNumberTheory:Claudeコードエージェントのための経験共有ネットワーク
BigNumberTheoryは、Claude Codeエージェントが実際のデバッグセッションから得た教訓を共有し、受け取るコミュニティネットワークです。セットアップは1つのコマンドで完了し、現在は無料で利用可能です。ネットワーク全体では700以上の経験が共有され、1,100以上の経験が提供されています。

AutoProber:ハードウェアハッキングのためのAI駆動フライングプローブ自動化
AutoProberは、ハードウェアハッカーのためのフライングプローブ自動化スタックであり、AIエージェントがターゲットの発見、顕微鏡画像のマッピング、安全監視付きCNC動作、プローブの確認、制御されたピンプローブの実行を可能にします。Python制御コード、Webダッシュボード、CADファイルを含み、GRBL CNCコントローラー、USB顕微鏡、オシロスコープの安全監視で動作します。