Claude Codeの請求を節約:計画トークンを低価格モデルにルーティング

Redditのユーザーが先月、Claude Codeでトークン使用量をモデル間で分割することで、超過料金を約40ドル節約したと報告している。重要なポイントは、計画段階(特に複数ファイルのリファクタリング)でトークン予算の最大80%を消費する可能性があるが、ほとんどの計画立案に最も高価なモデルは必要ないということだ。
仕組み
ユーザーは30行のラッパーを作成し、「何を変更すべきか」を考える初期作業を、より安価なモデルであるHaiku 3.5にルーティングした。実際の編集や意思決定のみをOpusまたはSonnetに残した。セットアップには約2時間かかり、どのステップを委任する価値があるかの判断も含まれる。
結果
前回のサイクルでは、4ヶ月ぶりに予算に余裕ができた。ユーザーは通常の2日間のリセット待ちを回避できた。節約額は約40ドルの超過料金である。
# ラッパーのロジックの擬似コード:
# 1. 計画プロンプトをhaiku-3.5に送信
# 2. ファイルと変更点のリストを受け取る
# 3. 計画と指示をopus/sonnetに渡して実際の編集を実行
注意点
アーキテクチャの決定において、Haikuの計画品質は明らかに劣る。Opusが実際の決定を引き継ぐリファクタリングとテストのワークフローでは問題ない。新規設計(「このアプリはそもそも何であるべきか」)の場合、ユーザーは依然としてOpusに最初から計画を任せている。
ユーザーは、このパターンは「OpenRouterのモデル価格表を見たことがある人ならおそらく明らか」と指摘するが、Claude Codeのサブエージェントドキュメントにはこの正確なアプローチに関する記述が少ない。
📖 出典全文: r/ClaudeAI
👀 See Also

日本語: エージェント対応コードベース:否定ルール、正確な命名、ディレクトリのREADME
開発者が、CLAUDE.mdのルール、否定命令、正確な命名によってトークンの無駄を削減し、Claude CodeがUserManagerのようなクラスを肥大化させるのを防いだ方法を共有しています。

ハートビート監視の代わりにOpenClaw Cronジョブを使用したスケジュールタスク
Redditの投稿では、朝のブリーフィングやメールの仕分けなどのスケジュールタスクにOpenClawのcronジョブ機能を使用する方法を説明しており、コンテキストの混入を防ぐための重要な--session isolatedフラグについて触れ、バージョン間での分離セッションにおける潜在的なバグについて警告しています。

OpenClaw v2026.3.13は、OpenAIトークンコスト削減のためのエージェントごとのcacheRetention設定を追加しました。
OpenClaw v2026.3.13では、エージェントごとのcacheRetention設定が追加され、OpenAIの24時間プロンプトキャッシュ保持が可能になりました。これにより、ハートビートサイクルが10分を超えるエージェントでは、入力トークンのコストを最大90%削減できる可能性があります。

クロードコードエージェントは自動的にプロジェクトドキュメントを読みません
Claude CodeがSonnetなどのサブエージェントをディスパッチしてコードを書かせる場合、それらのエージェントはプロンプトに明示的に含まれた内容しか認識せず、特に指示がない限りCLAUDE.md、MEMORY.md、その他のプロジェクトコンテキストファイルを自動的に読み込むことはありません。