Claude Codeにおける1億トークンの分析により、99.4%の入力使用率が明らかになりました。

1億トークンの追跡から見るトークン使用内訳
Claude Codeの使用状況を詳細に分析したところ、長時間のコーディングセッションにおける1,289件のリクエストを追跡し、合計約1億90万トークンに達しました。この内訳は、入力トークンと出力トークンの間に大きな不均衡があることを明らかにしています。
トークンの分布:
- 入力トークン: 1億30万(全体の99.4%)
- キャッシュされたトークン: 8,420万(入力の84%)
- 出力トークン: 61万6千(全体の0.6%)
コンテキスト再読み込みのボトルネック
Claude Codeはトークンバジェットの99.4%をコンテキストの読み込みに費やし、コードの記述にはわずか0.6%しか使用していません。このパターンはClaude Codeに特有のものではなく、現在のすべてのエージェント型コーディングシステムがどのように動作しているかを反映しています。Claude Codeがファイルを読み込む、コマンドを実行する、コードを編集するといった行動を起こすたびに、リポジトリ構造、会話履歴、ツールの結果、エラーログを含む完全なコンテキストを再入力する必要があります。
8,400万のキャッシュされたトークンは、モデルがターン間で永続的なメモリを持たないため、同じコンテキストが1,289回再送信されたことを表しています。人間の開発者がコードベースのメンタルモデルを維持するのとは異なり、Claude Codeは次のパターンに従います:すべてを忘れる → すべてを再読み込みする → コードを書く → 再びすべてを忘れる。
プロンプトキャッシングの限界
Anthropicのプロンプトキャッシングはこのプロセスをより安価にしますが、より速くはしません。ボトルネックは推論速度ではなく、再読み込みループです。この分析は、Claude Codeおよびエージェント型コーディング全般にとって真の突破口となるのは、永続的なプロジェクトメモリであることを示唆しています。これは、メモリファイルやCLAUDE.mdによる保存された事実だけでなく、セッションを超えて引き継がれる、コードベースの圧縮された進化する理解です。
現在のシステムは、理解を構築するのではなく、繰り返されるコンテキストを通じて知性を力ずくで実現しています。この状況が変われば、同じ情報を繰り返し処理する必要性を排除することで、AIコーディングを真に高速化できる日が来るかもしれません。
📖 完全なソースを読む: r/ClaudeAI
👀 See Also

ジェミニ エンベディング 2: Google初のネイティブマルチモーダル埋め込みモデルがリリース
GoogleはGemini Embedding 2をリリースしました。これは、テキスト、画像、動画、音声、文書を単一の埋め込み空間にマッピングする初のネイティブマルチモーダル埋め込みモデルです。このモデルは最大8192トークンのテキスト、リクエストごとに最大6枚の画像、120秒の動画、最大6ページのPDFをサポートし、3072から768までの柔軟な出力次元を備えています。

VS Code 1.117.0、コミット時に自動的にCopilotを共著者として追加 — そのトリガーとなる条件
VS Code 1.117.0 は、インライン提案を使用すると、たとえ一つのカンマであっても、コミットに「Co-authored-by: Copilot <[email protected]>」を追加します。この機能はオプトアウト方式で、明確に伝えられていません。

AIインフラに潜む金融バブル – 重要なポイント
AIインフラ支出ブームに対する批判的分析であり、過去のテクノロジー暴落と同様の持続不可能なバブルを警告する。このPDFは、GPUやデータセンターへの巨額の設備投資が実際の収益をはるかに上回っていると論じている。

Redditの議論では、AI生成コードのデバッグにおける課題が浮き彫りにされています。
r/ClaudeAIでのRedditディスカッションでは、AI生成コードが開発者に直面させる具体的な問題が詳細に語られています。これには、セキュリティの脆弱性、論理の幻覚、そして手動でコードを書くよりも時間がかかるデバッグ作業などが含まれます。