プロンプトキャッシュMCPプラグインは、安定したコンテキストを特定することで、Claude APIコストを自動的に削減します

プロンプトキャッシュは、Anthropicのキャッシュ機能を活用してClaude APIコストを自動的に削減するMCPプラグインです。Claude CodeやCursor/Windsurf/ZedをAnthropic APIと共に使用する場合、通常、各ターンでコンテキスト全体が最初から再送信されるため、長いデバッグセッション中に数千トークンがフルレートで繰り返し課金されます。
仕組み
Anthropicは、繰り返し読み取りのコストを1倍から0.1倍にするキャッシュ機能を提供していますが、これはキャッシュする内容を手動でマークする必要があります。プロンプトキャッシュプラグインはバックグラウンドで動作し、コンテキストの安定した部分(システムプロンプト、ツール定義、大きなファイルの読み取り)を識別し、各API呼び出しの前に自動的にマークします。
パフォーマンス結果
- 20ターンのバグ修正:85%削減
- 15ターンのリファクタリング:80%削減
- 40ターンのコーディングセッション:92%削減
インストール
Claude Codeユーザー向け:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Cursor/Windsurf/Zed向け:
npm install -g prompt-caching-mcp
その後、MCP設定をこのプラグインに向けてください。
このツールはMITライセンスの下でオープンソースであり、無料で利用できます。リポジトリは https://github.com/flightlesstux/prompt-caching にあります。
📖 Read the full source: r/ClaudeAI
👀 See Also

AgentPeek:Claude Codeエージェントチームを監視するオープンソースダッシュボード
AgentPeekは、Claude Codeに接続してエージェントチームの可視化を提供するローカルダッシュボードです。オーケストレーション階層、実行トレース、トークンコスト、ファイル操作などを表示します。インストールにはGitHubリポジトリのクローンとpipx installの実行が必要です。
MTP + ユニファイドメモリがRTX 5090でllama.cpp推論を30%高速化
GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 と MTP 推測を併用すると、128GB システム RAM を搭載した RTX 5090 上で Qwen3.6-27B Q8_0 のスループットが 49 tok/sec から 64 tok/sec に向上します。

Claudeユーザーのための無料AI製品ローンチプレイブックリポジトリ
ある開発者が、Claudeと効果的に連携するように設計された構造化されたプレイブックとして実用的なAI製品ローンチの経験を整理した、無料のリポジトリ「AI Product Launch Skill」を公開しました。

コードセットは、Git履歴からリポジトリ固有のコンテキストを活用して、コーディングエージェントを強化します。
Codesetは、過去のバグ、根本原因、共同変更の関係性などのコンテキストを提供する静的ファイルをgit履歴から生成します。テストでは、codeset-gym-pythonで5.3ポイント、SWE-Bench Proで2ポイントの改善が示されました。