OpenClawの7手法でトークンコスト95%削減

r/openclawのReddit投稿では、エージェントAIのトークンコストを劇的に95％以上削減する体系的なアプローチが概説されています。これらの手法は、システムプロンプト、ブートストラップファイルの読み込み、不要なLLM関与における隠れたオーバーヘッドをターゲットにしています。このガイドはユーザーA/Agent-Xによって執筆され、OpenClaw 2026.4.23+に適用されます。

パート1: 隠れたコストの理解

新しいセッション（/newまたは/reset）ごとに、AGENTS.md、SOUL.md、USER.md、およびスキル記述子がシステムプロンプトと起動コンテキストに読み込まれます。この固定オーバーヘッドは、特に頻繁なセッションでは急速に蓄積されます。

パート2: 定量的分析

最適化前は、一般的なブートストラップファイルセットがセッションあたり数十万トークンを消費する可能性がありました。手法適用後、その量はわずかになり、累積で大幅な節約につながりました。

パート3: 7つの中核的手法

ツリー構造のドキュメントアーキテクチャ: モノリシックなブートファイルを、必要なセクションのみを読み込む多層インデックスに置き換えます。測定データでは、トークン使用量がセッションあたり約150Kから15Kに削減されました。
AI自動圧縮（コンパクション）: OpenClawのコンパクション機構を使用して、システムプロンプトを動的に縮小します。機能を損なうことなくコンテキストを60〜80％削減します。
ローカルモデル管理（QMD/Ollama）: 軽量タスクを有料APIの代わりにローカルモデル（Ollama経由のQwenやLLamaなど）にオフロードします。これらのタスクでは90％以上のコスト削減が可能です。
スクリプトからAPIへの直接呼び出し: 自動化スクリプトではブートストラップを完全にバイパスし、最小限のシステムプロンプトでLLM APIを直接呼び出します。
LLM会話の代わりにコンソールコマンド: 決定論的な操作（ファイル操作、フォーマットなど）には、会話ループの代わりにCLIコマンドを実装します。
日常ロジックのCPU化（Python Cron）: 定期的なタスク（クリーンアップ、レポート作成、データ集約）をPythonのcronジョブに移行し、LLMの関与を排除します。
インテリジェントな要求のCPUへの引き戻し（ハートビートチェックリスト）: LLMベースの判断ループを、ローカルでチェックリストを実行するハートビートタスクに置き換え、異常な状態が検出された場合のみLLMを呼び出します。