全てのプロンプトで全てのMCPサーバーを読み込むと静かにトークン予算を浪費する

r/ClaudeAIの投稿では、微妙ながらもコストのかかる問題が報告されています。複数のMCPサーバーを設定していると、デフォルトではすべてのプロンプトで全てのサーバーが読み込まれるため、簡単なクエリでも無駄が生じます。このユーザーは5~6個のサーバーを使用していましたが、トークン使用量を確認するまで気づきませんでした。プロンプトごとに無関係なサーバー定義を読み込むためにトークンが消費されていたのです。
主な詳細
- 全てのプロンプトでMCPサーバーの全セット(5~6個)が読み込まれていた。
- 「今何時?」のような簡単なプロンプトでも、全てのサーバー定義がトリガーされていた。
- 解決策:プロンプトに関連するサーバーのみを選択するカスタムルーティング層。
- 結果:トークン使用量が大幅に減少し、プロンプト応答時間が改善された。
- 投稿者は「これだけ長い間チェックせずに放置していたのが信じられない」と述べている。
技術的背景
MCP(Model Context Protocol)サーバーは、Claudeの機能(ファイルシステムアクセス、データベースクエリ、Webスクレイピングなど)を拡張するツールです。多くのセットアップ(フォークされたクライアントや手動設定を含む)では、デフォルトで全てのサーバー定義リストがメッセージごとに送信されます。そのため、DBアクセス、ファイルI/O、Webブラウジングなどのツールが、実際のユーザー入力を処理する前にコンテキストウィンドウに全て投入されます。
ルーティング層は、ユーザーのメッセージ(またはシステムプロンプト)を検査し、説明やツールが意図と一致するMCPサーバーのみを条件付きで含めることができます。例えば、ファイルパスに言及するプロンプトはファイルツールを有効にし、株価に関する質問はファイナンスサーバーのみを読み込みます。これにより、無関係なサーバーメタデータによるトークンのオーバーヘッドを回避できます。
対象読者
複数のMCPサーバーでClaudeを実行している開発者、特にトークン効率が重要な自動パイプラインやカスタムフロントエンドを使用している方。
📖 全文を読む: r/ClaudeAI
👀 See Also
Claude + MCPブラウザ:ユーザー報告が強化するウェブアクセス
Claudeユーザーが、MCPを介してClaudeを外部ブラウザに接続することで、これまでアクセスできなかったサイトを操作できるようになったと報告し、Claudeがブラウザのモデルトークンを利用できるかどうか疑問を呈しています。

Claude Codeにおけるトークン浪費:ユーザーの自己監査が示す、モデル切り替えより行動修正が有効
あるユーザーがClaude Codeのトークン使用量を測定したところ、タスク間の/clear、編集前の計画、編集済みファイルの再読み込み禁止が、モデルを切り替えるよりも多くのトークンを節約できることがわかった。実践的な規律がラッパーより優れている。

OpenClaw LLMのコールドモデル読み込み時のタイムアウト修正
Redditユーザーが、OpenClawにおける特定のタイムアウト問題を特定し修正しました。この問題では、一般的なタイムアウト設定が高くても、コールドロードされたローカルLLMが約60秒後に失敗していました。解決策は、埋め込みランナーLLMのアイドルタイムアウト設定を調整することです。

高品質な応答をアンカーとして活用し、Claudeの長いスレッドでの出力のずれを防ぐ
A user describes how Claude responses degrade after 30-40 messages, and how they anchor the best mid-thread output to start fresh conversations.