エージェントフレームワークのトークン肥大化:500:1の入出力比率が正常

マルチプロバイダールーティングを使用したセルフホストのTelegramベースのAIエージェントを実行しているRedditユーザーが、極端な入力対出力トークン比に気付きました:メッセージあたり約21kの入力トークンに対し50~200の出力トークンで、比率は100:1から500:1。内訳:ツール定義約13kトークン、システムプロンプト約5k、メモリ/コンテキストファイル約3k、ユーザーメッセージ100トークン未満。
これは正常ですか?
コミュニティの反応は、LangChainやAutoGPTのようなエージェントフレームワークでは15~25kのベースラインコンテキストが標準であることを確認しています。高い比率は実際のツールアクセスを持つ構造上のものです。主な推奨事項:
- 安価なプライマリモデル — 肥大化してもコストは一定範囲に抑えられる
- プロンプトキャッシング — アクティブセッションでは節約になるが、TTLが5分のためアイドル期間をまたぐと効果が限定的
- 支出上限 — 安価なモデルでも必須のガードレール
緩和戦略
ユーザーは2つのアプローチについて議論:意図に基づいてメッセージごとにツール定義をトリミングする(動的ツール選択)か、肥大化を受け入れてキャッシングに頼るか。ベンチマークによると、スケールで構築する場合を除き、フレームワークをフォークしてオーバーヘッドを削減する必要性はほとんどない。コンセンサス:21kのコンテキストはエージェントフレームワークの「ビジネスコスト」である。
📖 全文ソース: r/openclaw
👀 See Also

Anthropicの非公開OAuthレート制限プールは、Claude Codeシステムプロンプトを必要とします
AnthropicのOAuthトークンを使用する際、APIはシステムプロンプトがClaude Codeとして識別されるかどうかに基づいて、リクエストをClaude Codeのレート制限プールにルーティングします。システムプロンプトに「You are Claude Code, Anthropic's official CLI for Claude.」を追加することで、不可解な429エラーが解消されます。

大規模なOpenClawプロジェクトにおけるメモリ管理のためのプロジェクトナラティブの活用
開発者が、主要なマイルストーンを達成するたびに、別のOpenClawワーカーを起動してコードベースを分析し、『プロジェクトナラティブ』文書を作成するプロセスを共有しています。これにより、メインワーカーが見落としがちな壊れたパイプライン、冗長性、欠落部分を特定するのに役立ちます。

CLAUDE.mdに1行追加するだけで、Claudeで絵文字で飾られたチェックリストを手に入れる
ユーザーレベルのCLAUDE.mdに1行のマーカーセットを追加すると、Claudeがチェックリストをステータス絵文字で装飾します — 完了、実行中、失敗、ブロックなど14の固定アイコンが利用可能です。

OpenClawコミュニティからの役立つヒント:AIエージェント最適化の深掘り
OpenClawコミュニティから、AIコーディングエージェントのパフォーマンスと効率を最適化するための貴重なヒントをご紹介します。これらの洞察は、あなたのAIプロジェクトに革命をもたらす可能性があります。