Verificação de preços do DeepSeek V4: tokens em cache 178x mais baratos que Opus, mas defasagem de capacidade reconhecida

O DeepSeek V4 foi lançado com preços tão baixos que um usuário do Reddit verificou as contas. Aqui estão os números confirmados:
Detalhamento de preços
- Entrada padrão do V4-Pro: US$ 0,145 por milhão de tokens. Entrada do Opus 4.7: ~US$ 5 por milhão. Proporção: 34x.
- Com 75% de desconto promocional (até o final de maio): entrada do V4-Pro cai para US$ 0,036 por milhão — 138x mais barato que o Opus.
- Preço de cache hit: V4-Pro custa US$ 0,0036 por milhão. Opus em cache custa US$ 0,625 por milhão. Proporção: 173x.
A ressalva
Como observa o post original, a DeepSeek admite que o V4 está de três a seis meses atrás do GPT-5.4 e do Gemini 3.1 Pro em capacidade. Você não está obtendo qualidade de ponta a um preço de ponta dividido por 178 — está obtendo qualidade de ponta do verão passado.
O que isso significa para fluxos de trabalho agentivos
Para loops agentivos com cache intenso (prompts de sistema, definições de ferramentas), o desconto de cache hit é a verdadeira história. Prompts de sistema reutilizáveis tornam-se essencialmente gratuitos. A incógnita principal: se a janela de contexto de 1 milhão de tokens se mantém em cargas de trabalho reais ou degrada para 200 mil utilizáveis, como visto em muitos modelos de janela grande.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Atualização do Ranking SWE-rebench: Resultados de fevereiro de 2026 mostram competição acirrada
O quadro de líderes SWE-rebench foi atualizado com os resultados de fevereiro de 2026, testando 57 novas tarefas de PR do GitHub. O Claude Opus 4.6 lidera com uma taxa de resolução de 65,3%, mas os seis principais modelos estão dentro de 5 pontos percentuais.

Extensão do Claude Code para IDE falha ao carregar no Windows – Atualização de Status
Uma atualização oficial de status informa que a extensão Claude Code IDE não consegue carregar no Windows a partir de 2026-05-08T22:32:19Z. Acompanhe o progresso e a resolução através da página de status.

Claude Sonnet 4.6 Revelado: Capacidades Aprimoradas de Programação e Uso de Computador
O Claude Sonnet 4.6 apresenta uma janela de contexto de 1 milhão de tokens e aprimora habilidades de programação e uso de computador, tornando-se uma alternativa robusta aos modelos da classe Opus para uma gama mais ampla de tarefas.

DystopiaBench Expandido: 42 Modelos Testados em 6 Tipos de Distopia — Claude Opus 4.7 Lidera Todos
DystopiaBench adiciona módulos Huxley e Baudrillard, testa 42 modelos incluindo GPT-5.5, Gemini 3.1 Pro, Grok 4.3 e GLM-5.1. Claude Opus 4.7 recusa consistentemente solicitações nocivas nos níveis L4-L5 em todos os cenários, enquanto outros atendem até L4 ou mesmo L5.