DeepSeek V4 Flash コスト分析：キャッシュヒット率97%・価格比0.02

あるRedditユーザーが、OpenClaw（PIエージェントループ使用）とOpenRouter上で動作する922件のエージェントタクトレースを分析し、DeepSeek V4 FlashとOpus 4.7を比較しました。コストの差は驚くべきものです：DeepSeekは1タスクあたり0.01ドル、Opusは1.52ドルで、トークン数（平均約962K）やツール呼び出し数（平均約14）はほぼ同じです。価格比は0.0066倍で、入力トークンの価格のみから予想される0.03倍を大幅に下回っています。

DeepSeekが安い理由：キャッシュヒット率と読み書き価格

この差には2つの要因があります：

キャッシュヒット率： DeepSeek V4 Flashは97%に対し、Opus 4.7は87%。これらのキャッシュ読み書き価格比では、キャッシュヒット率が1%高いごとに全体コストが約20%低下します。DeepSeekの10%の優位性により、総コストの約3分の2が削減されます。
キャッシュ読み書き価格比： DeepSeekの比率は0.02（キャッシュ読み取りコストはキャッシュミス書き込みの2%）ですが、Opusは0.08で、OpenAI、Anthropic、Gemini（0.08～0.10）と同等です。これだけでさらにコストが半減します。

積み上げ効果

タスクあたりのトークン数とツール数が同程度であるため、DeepSeekの総コストはOpusの0.0066倍になります。ユーザーは、これらの効率改善がインフラストラクチャまたはモデルアーキテクチャレベル（例えば、より優れたキャッシュ戦略）で設計されていると推測しています。正確なメカニズムは公開されていません。

📖 出典全文を読む： r/LocalLLaMA

DeepSeek V4 Flash コスト分析：キャッシュヒット率と価格比率の解説

DeepSeekが安い理由：キャッシュヒット率と読み書き価格

積み上げ効果

👀 See Also

ジェンセン・フアンのGTC 2026におけるOpenClaw主張とNVIDIAの戦略の分析

非営利団体がチームおよびエンタープライズプランでClaude Opus 4.6にアクセス可能に

ウィキペディアは、ボット承認プロセスに違反したAIエージェント「Tom-Assistant」を禁止しました。

Anthropic、ピッチブック、KYC、月末締め処理向けの10の金融AIエージェントを発表