Claude Codeにおける並列サブエージェント:トークンの節約と消費

「サブエージェントを使え!」という誇大広告の中でしばしば無視されるAnthropicの数字:マルチエージェントシステムは単一チャットの約15倍のトークンを消費し、「コーディングのような密接に依存するタスクには効果が低い」(出典)。しかし、キャッシュされたトークンは通常の10%のコスト(90%割引)で済む——ただし、キャッシュ対象としてマークされたコンテンツがリクエスト間で同一である場合に限る(出典)。
マルチエージェントはトークン使用量を15倍にし、キャッシュはそれを10分の1にする。サブエージェントが節約になるか浪費になるかは、ただ一点にかかっている:すべてのサブエージェントが同じプレフィックスを共有するかどうか?
委譲の3つの方法、コスト順
- 1.
subagent_typeを設定したサブエージェント。カスタムシステムプロンプト、カスタムツール、カスタム権限(Anthropic)。プロンプトが異なる=キャッシュも異なる。親と共有されず、生成ごとに全額コスト。本当に分離が必要な場合に使用。 - 2. 親を継承したクローン。
subagent_typeなし。親のプロンプト、ツール、履歴をそのまま継承。子エージェント2番目以降は10%のコストでキャッシュヒット。5つのクローンが並行してファイルを読む場合、約5倍の速度で約1.5倍のコスト。 - 3. サブエージェントを使わない。メインエージェントに留まる。ターンあたり最も安い。作業がそれ自体に依存する場合に適切——ステップ2がステップ1の結果を必要とするリファクタリングなど。
委譲すべきでない時(Anthropic自身の線引き)
「並行した調査のストランドに分割できるタスクに最適。」 つまり:
- 良い例:7つのファイルを並行して読む、パターンについてフォルダを監査する、多くの情報源から情報を集める。
- 悪い例:モジュールをリファクタリングする、各ステップが前のステップに依存するバグ修正。メインエージェントのみ。
密結合された作業をサブエージェントに分割すると、15倍のコストを払って何も得られない。
キャッシュを壊すもの
Anthropic:ツール定義の編集、モデルの切り替え、画像の追加/削除、以前のプロンプト構造の変更は、キャッシュされたプレフィックスを壊す(出典)。つまり:
- MCPはセッション開始時にインストールし、途中では行わない。
- モデルは事前に選択する。
CLAUDE.mdや自動メモリをセッション途中で編集しない——これらはキャッシュされたプレフィックス内に存在する。
📖 全文ソースを読む: r/ClaudeAI
👀 See Also

Redditユーザーが金融口座残高を収集するAIツールを共有
r/openclawのReddit投稿では、Pythonを使用して金融口座残高の収集を効率化するために設計されたAIエージェントが紹介されています。ユーザーは、PlaidのようなAPIを活用したカスタムスクリプトによる自動化の可能性について議論しています。

PocketBot: AIがコスト効率の良い、確定的なスケジューリングのために自動化をJavaScriptにコンパイルします。
PocketBotは、自然言語リクエストを自己完結型のJavaScriptスクリプトにコンパイルし、実行時にLLM呼び出しなしでスケジュール実行することで、APIとハードウェアのコスト問題に対処します。このツールはコード記述にAIを一度だけ使用し、その後はGoogle Suite、Slack、Notionを含む20以上の統合機能で決定論的に実行されます。

LLMock: プロセス間での決定論的LLMテストのためのHTTPベースのモッキングサーバー
LLMockは、OpenAI、Claude、GeminiのAPIを模倣する実際のHTTPサーバーであり、開発者が実際のAPIにアクセスすることなく、複数のプロセスで決定論的テストを実行できるようにします。SSEストリーミング、ツール呼び出し、述語ルーティング、リクエストジャーナリングをサポートし、依存関係はゼロです。

2025年4月15日~5月3日 トップ6のオープンソースClaudeスキル
過去15日間の6つのオープンソースClaudeスキル:ブランドアルケミー、npm-downloads-to-leads、hyperframes、email-newsletter、pricingなど。各スキルの機能を詳しく解説。