Explicação da Taxa de Acerto de Cache e Relação de Preço do DeepSeek V4 Flash

Um usuário do Reddit analisou 922 rastros de tarefas de agente executadas no OpenClaw (com loop de agente PI) e OpenRouter, comparando DeepSeek V4 Flash com Opus 4.7. A diferença de custo é impressionante: US$ 0,01 por tarefa para DeepSeek contra US$ 1,52 para Opus, apesar de contagens de tokens semelhantes (~962K em média) e chamadas de ferramentas (~14 em média). A relação de preço é 0,0066x, muito abaixo dos esperados 0,03x com base apenas no preço do token de entrada.
Por que DeepSeek é mais barato: Taxa de acerto de cache e preço de leitura/escrita
Dois fatores explicam a diferença:
- Taxa de acerto de cache: DeepSeek V4 Flash alcançou 97% contra 87% do Opus 4.7. Nessas relações de preço de leitura/escrita de cache, cada 1% a mais de acerto de cache reduz o custo total em ~20%. A vantagem de 10% da DeepSeek corta cerca de 2/3 do custo total.
- Relação de preço de leitura/escrita de cache: A relação da DeepSeek é 0,02 (leitura de cache custa 2% de uma escrita sem acerto), enquanto a Opus está em 0,08 — comparável à OpenAI, Anthropic e Gemini (0,08–0,10). Isso por si só reduz ainda mais o custo pela metade.
Como isso se acumula
Com tokens e ferramentas semelhantes por tarefa, o custo total da DeepSeek é 0,0066x o do Opus. O usuário especula que essas eficiências são projetadas no nível de infraestrutura ou arquitetura do modelo (por exemplo, melhor estratégia de cache). O mecanismo exato não é divulgado.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Razão do Projeto Zig para sua Política Rigorosa Anti-LLM de Contribuições
Zig impõe uma proibição total a contribuições assistidas por LLM: nada de IA para issues, PRs ou comentários. O VP Loris Cro explica a filosofia do "pôquer do contribuidor" — revisar PRs é um investimento no crescimento de contribuidores confiáveis, não apenas na aprovação de código.

Claude Code Bug Substitui Umlauts Alemães por Substitutos ASCII
O Claude Code e o aplicativo Claude.ai têm substituído aleatoriamente os tremas alemães (ä, ö, ü, ß) por substitutos ASCII (ae, oe, ue, ss) desde dezembro de 2025. O bug persiste apesar das instruções explícitas e permanece sem correção há mais de 3 meses, sem resposta do suporte da Anthropic.

Pesquisadores da Universidade de Washington planejam usar câmeras usadas por professores para treinamento de IA, pais podem optar por não participar
Pesquisadores da Universidade de Washington planejaram que professores de pré-escola usassem câmeras em primeira pessoa para gravar crianças para treinamento de modelos de IA, com um modelo de consentimento de exclusão.

Do Prompting à Engenharia de Especificação: A Mudança para a Arquitetura Planejador-Executor
O desenvolvimento de IA está mudando de prompts baseados em chat simples para uma arquitetura planejador-trabalhador, onde humanos atuam como engenheiros de especificação. Isso requer definir critérios de aceitação rigorosos, arquitetura de restrições e padrões de decomposição para agentes de IA autônomos.