Claude Code 1億トークン分析：入力99.4% vs 出力0.6%

1億トークンの追跡から見るトークン使用内訳

Claude Codeの使用状況を詳細に分析したところ、長時間のコーディングセッションにおける1,289件のリクエストを追跡し、合計約1億90万トークンに達しました。この内訳は、入力トークンと出力トークンの間に大きな不均衡があることを明らかにしています。

トークンの分布:

入力トークン: 1億30万（全体の99.4%）
キャッシュされたトークン: 8,420万（入力の84%）
出力トークン: 61万6千（全体の0.6%）

コンテキスト再読み込みのボトルネック

Claude Codeはトークンバジェットの99.4%をコンテキストの読み込みに費やし、コードの記述にはわずか0.6%しか使用していません。このパターンはClaude Codeに特有のものではなく、現在のすべてのエージェント型コーディングシステムがどのように動作しているかを反映しています。Claude Codeがファイルを読み込む、コマンドを実行する、コードを編集するといった行動を起こすたびに、リポジトリ構造、会話履歴、ツールの結果、エラーログを含む完全なコンテキストを再入力する必要があります。

8,400万のキャッシュされたトークンは、モデルがターン間で永続的なメモリを持たないため、同じコンテキストが1,289回再送信されたことを表しています。人間の開発者がコードベースのメンタルモデルを維持するのとは異なり、Claude Codeは次のパターンに従います：すべてを忘れる → すべてを再読み込みする → コードを書く → 再びすべてを忘れる。

プロンプトキャッシングの限界

Anthropicのプロンプトキャッシングはこのプロセスをより安価にしますが、より速くはしません。ボトルネックは推論速度ではなく、再読み込みループです。この分析は、Claude Codeおよびエージェント型コーディング全般にとって真の突破口となるのは、永続的なプロジェクトメモリであることを示唆しています。これは、メモリファイルやCLAUDE.mdによる保存された事実だけでなく、セッションを超えて引き継がれる、コードベースの圧縮された進化する理解です。

現在のシステムは、理解を構築するのではなく、繰り返されるコンテキストを通じて知性を力ずくで実現しています。この状況が変われば、同じ情報を繰り返し処理する必要性を排除することで、AIコーディングを真に高速化できる日が来るかもしれません。

📖 完全なソースを読む: r/ClaudeAI

Claude Codeにおける1億トークンの分析により、99.4%の入力使用率が明らかになりました。

1億トークンの追跡から見るトークン使用内訳

コンテキスト再読み込みのボトルネック

プロンプトキャッシングの限界

👀 See Also

アナム・カラ-3：インタラクティブAIアバターの進歩

西洋は建設方法を忘れた：防衛サプライチェーンの崩壊とソフトウェア工学への教訓

クラウボットコミュニティがインターフェース改善の可能性について議論

Opus 4.7の注意劣化：256kコンテキストでMRCRスコアが92%から59%に低下