Bug de Cobrança da API da Anthropic: Modelo Sonnet Cobrado com Tarifas do Opus

Detalhes do Bug
Uma discrepância significativa na cobrança foi identificada na API da Anthropic para o modelo claude-sonnet-4-6. Embora a API reporte corretamente o modelo como Sonnet na resposta, o cálculo real da cobrança usa os preços do Opus, resultando em cobranças mais altas do que o esperado.
Evidências dos Dados Brutos de Eventos
O bug foi descoberto através da análise de uma requisição com alto número de tokens e uso intensivo de cache de prompt. Os pontos específicos dos dados brutos do evento são:
- Modelo Reportado: claude-sonnet-4-6
- Tokens de Entrada: 6
- Tokens de Saída: 4.034
- Criação de Cache (Escrita): 61.920 tokens
- Leitura de Cache: 171.391 tokens
- Custo Total Cobrado (USD): $0,5735755
O usuário observou que este custo total corresponde exatamente ao que seria esperado para os preços do Opus, não para os preços do Sonnet, criando uma diferença significativa de custo para os usuários da API.
Impacto e Contexto
Este bug afeta desenvolvedores que usam a API Claude da Anthropic com o modelo Sonnet. Como o Opus é o nível de modelo mais caro da Anthropic, essa discrepância pode resultar em custos substancialmente mais altos do que o antecipado. O bug parece estar na lógica de cálculo da cobrança, e não na seleção do modelo em si, já que a API identifica corretamente o modelo como Sonnet nas respostas.
Para desenvolvedores que monitoram os custos da API, isso significa que os relatórios de cobrança atuais podem estar imprecisos para o uso do Sonnet. O problema foi relatado no subreddit ClaudeAI, onde os usuários estão discutindo possíveis soluções alternativas e monitorando uma correção oficial da Anthropic.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Infraestrutura de Agentes para Operações PME: Um White Paper de um Operador de QSR que se Tornou Construtor
Um operador de QSR há 16 anos publicou um white paper defendendo uma camada de infraestrutura ausente entre o chat genérico de IA e os painéis verticais de SaaS, com 8 habilidades no ClawHub, mais de 1.500 downloads e uma implantação ao vivo fora do QSR.

Codificação Agentiva é uma Armadilha: Dívida Cognitiva e Atrofia
Lars Faye argumenta que ferramentas de codificação agentivas como Claude Code causam atrofia cognitiva, dependência de fornecedor e aumento de complexidade, transferindo o fardo de escrever código para revisar código gerado, o que degrada as habilidades dos desenvolvedores.

Configuração de Subagentes no OpenClaw: Considerações-Chave
Usuários que estão experimentando o OpenClaw estão enfrentando problemas ao configurar subagentes, especialmente ao modificar arquivos JSON.

Previsão Multi-Token MTP: Geração de Tokens 2x Mais Rápida no AMD Strix Halo & Radeon 9700 AI Pro
MTP acelera a inferência de LLMs em até 2x, especialmente para agentes de codificação. O vídeo aborda a mecânica do MTP e o desempenho no Qwen 3.6 com AMD Strix Halo e Dual Radeon 9700.