API課金移行でコスト削減：Claude SonnetとOpusのルーティング戦略

API課金移行とコストへの影響

PT正午より、AnthropicのMaxサブスクリプションはOpenClawなどのサードパーティツールからの利用をカバーしなくなりました。すべてのOpenClawユーザーは以下の料金でAPI課金に移行します：

Claude Opus 4.6：入力100万トークンあたり5ドル、出力100万トークンあたり25ドル
Claude Sonnet 4.6：入力100万トークンあたり3ドル、出力100万トークンあたり15ドル
Claude Haiku 4.5：入力100万トークンあたり1ドル、出力100万トークンあたり5ドル

Opusでの重いOpenClawセッションは1〜4ドルかかる一方、同じセッションをSonnetで実行すると0.20〜0.80ドルで、ほとんどのタスクで同様の結果が得られます。

ルーティングソリューション

ほとんどのOpenClaw操作はOpusを必要としません：ハートビートチェック、ファイル読み込み、要約、ルーティング決定、短いツール呼び出しはすべてSonnetで処理可能です。ルーティング層がない場合、すべてのリクエストがデフォルトモデルに送信され、単純なタスクにOpusの予算を無駄にする可能性があります。

ローカルプロキシはClaudeリクエストを複雑さに基づいて振り分けます：単純なタスクは自動的にSonnetに、複雑なタスクはOpusにエスカレートされます。このアプローチにより、重要なタスクの品質を損なうことなく、コストを大幅に削減できました。

プロキシはオープンソースで、npm経由でインストール可能です：npm install -g @relayplane/proxy

詳細なドキュメントと議論はr/ClaudeCodeで利用可能で、このソリューションは52Kの閲覧数を記録しています。

📖 Read the full source: r/openclaw