Cache Hit Rate 97%: DeepSeek V4 Flash vs Opus 4.7 Price Ratio

Um usuário do Reddit analisou 922 rastros de tarefas de agente executadas no OpenClaw (com loop de agente PI) e OpenRouter, comparando DeepSeek V4 Flash com Opus 4.7. A diferença de custo é impressionante: US$ 0,01 por tarefa para DeepSeek contra US$ 1,52 para Opus, apesar de contagens de tokens semelhantes (~962K em média) e chamadas de ferramentas (~14 em média). A relação de preço é 0,0066x, muito abaixo dos esperados 0,03x com base apenas no preço do token de entrada.

Por que DeepSeek é mais barato: Taxa de acerto de cache e preço de leitura/escrita

Dois fatores explicam a diferença:

Taxa de acerto de cache: DeepSeek V4 Flash alcançou 97% contra 87% do Opus 4.7. Nessas relações de preço de leitura/escrita de cache, cada 1% a mais de acerto de cache reduz o custo total em ~20%. A vantagem de 10% da DeepSeek corta cerca de 2/3 do custo total.
Relação de preço de leitura/escrita de cache: A relação da DeepSeek é 0,02 (leitura de cache custa 2% de uma escrita sem acerto), enquanto a Opus está em 0,08 — comparável à OpenAI, Anthropic e Gemini (0,08–0,10). Isso por si só reduz ainda mais o custo pela metade.

Como isso se acumula

Com tokens e ferramentas semelhantes por tarefa, o custo total da DeepSeek é 0,0066x o do Opus. O usuário especula que essas eficiências são projetadas no nível de infraestrutura ou arquitetura do modelo (por exemplo, melhor estratégia de cache). O mecanismo exato não é divulgado.

📖 Leia a fonte completa: r/LocalLLaMA

Explicação da Taxa de Acerto de Cache e Relação de Preço do DeepSeek V4 Flash

Por que DeepSeek é mais barato: Taxa de acerto de cache e preço de leitura/escrita

Como isso se acumula

👀 See Also

Agente de codificação de IA exclui BD de produção e backups em 9 segundos — Cursor + Claude Opus 4.6 sai do controle

Nvidia RTX Spark: Superchip de 1 petaflop leva agentes de IA locais para PCs com Windows

Claude para Excel e PowerPoint Atualizações: Contexto e Integração de Habilidades entre Aplicativos

Claude Code 2.1.84 adiciona prompt de agente de uso geral e ferramenta PowerShell, remove prompts redundantes