Explicação da Taxa de Acerto de Cache e Relação de Preço do DeepSeek V4 Flash

✍️ OpenClawRadar📅 Publicado: May 7, 2026🔗 Source
Explicação da Taxa de Acerto de Cache e Relação de Preço do DeepSeek V4 Flash
Ad

Um usuário do Reddit analisou 922 rastros de tarefas de agente executadas no OpenClaw (com loop de agente PI) e OpenRouter, comparando DeepSeek V4 Flash com Opus 4.7. A diferença de custo é impressionante: US$ 0,01 por tarefa para DeepSeek contra US$ 1,52 para Opus, apesar de contagens de tokens semelhantes (~962K em média) e chamadas de ferramentas (~14 em média). A relação de preço é 0,0066x, muito abaixo dos esperados 0,03x com base apenas no preço do token de entrada.

Por que DeepSeek é mais barato: Taxa de acerto de cache e preço de leitura/escrita

Dois fatores explicam a diferença:

  • Taxa de acerto de cache: DeepSeek V4 Flash alcançou 97% contra 87% do Opus 4.7. Nessas relações de preço de leitura/escrita de cache, cada 1% a mais de acerto de cache reduz o custo total em ~20%. A vantagem de 10% da DeepSeek corta cerca de 2/3 do custo total.
  • Relação de preço de leitura/escrita de cache: A relação da DeepSeek é 0,02 (leitura de cache custa 2% de uma escrita sem acerto), enquanto a Opus está em 0,08 — comparável à OpenAI, Anthropic e Gemini (0,08–0,10). Isso por si só reduz ainda mais o custo pela metade.
Ad

Como isso se acumula

Com tokens e ferramentas semelhantes por tarefa, o custo total da DeepSeek é 0,0066x o do Opus. O usuário especula que essas eficiências são projetadas no nível de infraestrutura ou arquitetura do modelo (por exemplo, melhor estratégia de cache). O mecanismo exato não é divulgado.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Razão do Projeto Zig para sua Política Rigorosa Anti-LLM de Contribuições
News

Razão do Projeto Zig para sua Política Rigorosa Anti-LLM de Contribuições

Zig impõe uma proibição total a contribuições assistidas por LLM: nada de IA para issues, PRs ou comentários. O VP Loris Cro explica a filosofia do "pôquer do contribuidor" — revisar PRs é um investimento no crescimento de contribuidores confiáveis, não apenas na aprovação de código.

OpenClawRadar
Claude Code Bug Substitui Umlauts Alemães por Substitutos ASCII
News

Claude Code Bug Substitui Umlauts Alemães por Substitutos ASCII

O Claude Code e o aplicativo Claude.ai têm substituído aleatoriamente os tremas alemães (ä, ö, ü, ß) por substitutos ASCII (ae, oe, ue, ss) desde dezembro de 2025. O bug persiste apesar das instruções explícitas e permanece sem correção há mais de 3 meses, sem resposta do suporte da Anthropic.

OpenClawRadar
Pesquisadores da Universidade de Washington planejam usar câmeras usadas por professores para treinamento de IA, pais podem optar por não participar
News

Pesquisadores da Universidade de Washington planejam usar câmeras usadas por professores para treinamento de IA, pais podem optar por não participar

Pesquisadores da Universidade de Washington planejaram que professores de pré-escola usassem câmeras em primeira pessoa para gravar crianças para treinamento de modelos de IA, com um modelo de consentimento de exclusão.

OpenClawRadar
Do Prompting à Engenharia de Especificação: A Mudança para a Arquitetura Planejador-Executor
News

Do Prompting à Engenharia de Especificação: A Mudança para a Arquitetura Planejador-Executor

O desenvolvimento de IA está mudando de prompts baseados em chat simples para uma arquitetura planejador-trabalhador, onde humanos atuam como engenheiros de especificação. Isso requer definir critérios de aceitação rigorosos, arquitetura de restrições e padrões de decomposição para agentes de IA autônomos.

OpenClawRadar