Claude Code節約術：Haiku 3.5で計画、40ドル削減

Redditのユーザーが先月、Claude Codeでトークン使用量をモデル間で分割することで、超過料金を約40ドル節約したと報告している。重要なポイントは、計画段階（特に複数ファイルのリファクタリング）でトークン予算の最大80％を消費する可能性があるが、ほとんどの計画立案に最も高価なモデルは必要ないということだ。

仕組み

ユーザーは30行のラッパーを作成し、「何を変更すべきか」を考える初期作業を、より安価なモデルであるHaiku 3.5にルーティングした。実際の編集や意思決定のみをOpusまたはSonnetに残した。セットアップには約2時間かかり、どのステップを委任する価値があるかの判断も含まれる。

結果

前回のサイクルでは、4ヶ月ぶりに予算に余裕ができた。ユーザーは通常の2日間のリセット待ちを回避できた。節約額は約40ドルの超過料金である。

# ラッパーのロジックの擬似コード:
# 1. 計画プロンプトをhaiku-3.5に送信
# 2. ファイルと変更点のリストを受け取る
# 3. 計画と指示をopus/sonnetに渡して実際の編集を実行

注意点

アーキテクチャの決定において、Haikuの計画品質は明らかに劣る。Opusが実際の決定を引き継ぐリファクタリングとテストのワークフローでは問題ない。新規設計（「このアプリはそもそも何であるべきか」）の場合、ユーザーは依然としてOpusに最初から計画を任せている。

ユーザーは、このパターンは「OpenRouterのモデル価格表を見たことがある人ならおそらく明らか」と指摘するが、Claude Codeのサブエージェントドキュメントにはこの正確なアプローチに関する記述が少ない。

📖 出典全文: r/ClaudeAI

Claude Codeの請求を節約：計画トークンを低価格モデルにルーティング

仕組み

結果

注意点

👀 See Also

日本語: エージェント対応コードベース：否定ルール、正確な命名、ディレクトリのREADME

ハートビート監視の代わりにOpenClaw Cronジョブを使用したスケジュールタスク

OpenClaw v2026.3.13は、OpenAIトークンコスト削減のためのエージェントごとのcacheRetention設定を追加しました。

クロードコードエージェントは自動的にプロジェクトドキュメントを読みません