並列サブエージェントでトークン節約？Claude Codeのコスト分析

「サブエージェントを使え！」という誇大広告の中でしばしば無視されるAnthropicの数字：マルチエージェントシステムは単一チャットの約15倍のトークンを消費し、「コーディングのような密接に依存するタスクには効果が低い」（出典）。しかし、キャッシュされたトークンは通常の10%のコスト（90%割引）で済む——ただし、キャッシュ対象としてマークされたコンテンツがリクエスト間で同一である場合に限る（出典）。

マルチエージェントはトークン使用量を15倍にし、キャッシュはそれを10分の1にする。サブエージェントが節約になるか浪費になるかは、ただ一点にかかっている：すべてのサブエージェントが同じプレフィックスを共有するかどうか？

委譲の3つの方法、コスト順

1. subagent_typeを設定したサブエージェント。カスタムシステムプロンプト、カスタムツール、カスタム権限（Anthropic）。プロンプトが異なる＝キャッシュも異なる。親と共有されず、生成ごとに全額コスト。本当に分離が必要な場合に使用。
2. 親を継承したクローン。subagent_typeなし。親のプロンプト、ツール、履歴をそのまま継承。子エージェント2番目以降は10%のコストでキャッシュヒット。5つのクローンが並行してファイルを読む場合、約5倍の速度で約1.5倍のコスト。
3. サブエージェントを使わない。メインエージェントに留まる。ターンあたり最も安い。作業がそれ自体に依存する場合に適切——ステップ2がステップ1の結果を必要とするリファクタリングなど。

委譲すべきでない時（Anthropic自身の線引き）

「並行した調査のストランドに分割できるタスクに最適。」 つまり：

良い例：7つのファイルを並行して読む、パターンについてフォルダを監査する、多くの情報源から情報を集める。
悪い例：モジュールをリファクタリングする、各ステップが前のステップに依存するバグ修正。メインエージェントのみ。

密結合された作業をサブエージェントに分割すると、15倍のコストを払って何も得られない。

キャッシュを壊すもの

Anthropic：ツール定義の編集、モデルの切り替え、画像の追加/削除、以前のプロンプト構造の変更は、キャッシュされたプレフィックスを壊す（出典）。つまり：

MCPはセッション開始時にインストールし、途中では行わない。
モデルは事前に選択する。
CLAUDE.mdや自動メモリをセッション途中で編集しない——これらはキャッシュされたプレフィックス内に存在する。

📖 全文ソースを読む： r/ClaudeAI

Claude Codeにおける並列サブエージェント：トークンの節約と消費

委譲の3つの方法、コスト順

委譲すべきでない時（Anthropic自身の線引き）

キャッシュを壊すもの

👀 See Also

Redditユーザーが金融口座残高を収集するAIツールを共有

PocketBot: AIがコスト効率の良い、確定的なスケジューリングのために自動化をJavaScriptにコンパイルします。

LLMock: プロセス間での決定論的LLMテストのためのHTTPベースのモッキングサーバー

2025年4月15日～5月3日トップ6のオープンソースClaudeスキル

委譲の3つの方法、コスト順

委譲すべきでない時（Anthropic自身の線引き）

キャッシュを壊すもの

👀 See Also

Redditユーザーが金融口座残高を収集するAIツールを共有

PocketBot: AIがコスト効率の良い、確定的なスケジューリングのために自動化をJavaScriptにコンパイルします。

LLMock: プロセス間での決定論的LLMテストのためのHTTPベースのモッキングサーバー

2025年4月15日～5月3日 トップ6のオープンソースClaudeスキル

2025年4月15日～5月3日トップ6のオープンソースClaudeスキル