同一リファクタリングでコスト削減：ルーティングエージェントのサブタスク振り分け術

ある開発者がr/ClaudeAIで、エージェントループの実用的なコスト最適化戦略について説明しています。ルーティン的なサブタスクは安価なモデルに振り分け、複雑な推論にのみ高価なモデル（Opus 4.7）を予約するというものです。CSS変数のリネーム、YAML設定の更新、MCPを介したlinter実行などを処理するリファクタリングエージェントは、当初すべてのステップをOpus 4.7に送信し、合計約18ドルかかっていました。ルーティングロジックを実装した結果、212ステップのうち178ステップが安価なモデルに振り向けられ、コストは約4ドルに削減され、ルーティン的な変更では品質に目立った差は見られませんでした。

ルーティングロジック

難しいサブタスク → Opus 4.7: コンポーネントアーキテクチャ、深夜のコードのデバッグ、長い会話にわたって持続的な推論が必要なもの。著者は、Opusがその種の作業で真に比類のない存在であると述べています。以前、認証ミドルウェアのバグを安価なモデルにルーティングしようとしたところ、セッション処理が静かに壊れ、トレースに1時間かかりました。
ルーティン的なサブタスク → 安価なモデル: Lint、リネーム、設定編集、ツールオーケストレーション。著者は、一般的なコーディング作業にはDeepSeek V4 Pro、大量のツール呼び出しにはTencent Hunyuan Hy3プレビューを採用しました。4月下旬時点で、Hunyuan Hy3はOpenRouterでツール呼び出し量で第1位にランクされ、スキーマが整っている場合、関数呼び出しをほぼミスしません。

コスト比較

Opus 4.7: 入力トークン100万あたり約0.18ドル（約28倍安い代替手段との比較から推定）。
Tencent Hunyuan Hy3: 入力トークン100万あたり0.18ドル、出力100万あたり0.59ドル — 入力ではOpus 4.7より約28倍安い。
同じ212ステップのリファクタリング: 178ステップが安価な階層、34ステップがOpusに。コストは18ドルから約4ドルに低下。