Bugs no Cache de Código do Claude Podem Aumentar os Custos da API em 10 a 20 Vezes

Uma postagem no Reddit na comunidade ClaudeCode relata dois bugs relacionados ao cache no Claude Code que podem aumentar significativamente os custos da API. De acordo com a fonte, esses bugs podem fazer com que os custos da API aumentem silenciosamente em 10 a 20 vezes o valor esperado.
Detalhes da Fonte
A informação vem de uma postagem no Reddit intitulada "PSA: Claude Code tem dois bugs de cache que podem silenciosamente aumentar os custos da API em 10 a 20 vezes" publicada na comunidade r/ClaudeCode. A postagem gerou discussão no Hacker News com 27 pontos e 3 comentários no momento do relatório.
Bugs de cache em assistentes de codificação com IA como o Claude Code podem ser particularmente problemáticos porque afetam como o sistema reutiliza conteúdo previamente gerado. Quando os mecanismos de cache falham, o sistema pode regenerar conteúdo desnecessariamente, levando a chamadas repetidas de API e aumento de custos sem mudanças visíveis na funcionalidade.
Contexto Técnico
Assistentes de codificação com IA normalmente implementam cache para reduzir chamadas redundantes de API e controlar custos. O Claude Code, como ferramentas similares, provavelmente usa cache para armazenar e reutilizar resultados de geração de código quando prompts similares são fornecidos. Bugs de cache em tais sistemas podem derrotar esses mecanismos de otimização, fazendo com que a ferramenta faça chamadas completas de API para operações que deveriam ser atendidas do cache.
Para desenvolvedores que usam o Claude Code, monitorar o uso e os custos da API é recomendado, especialmente ao trabalhar com tarefas de codificação repetitivas ou similares onde o cache deveria fornecer o maior benefício.
📖 Read the full source: HN AI Agents
👀 See Also

Anthropic Lança 10 Agentes de IA Financeiros para Pitchbooks, KYC, Fechamento de Mês
A Anthropic lançou 10 agentes de IA prontos para uso em serviços financeiros e seguros, abrangendo criação de pitchbooks, triagem KYC e fechamento mensal, entregues via Claude Cowork, Claude Code e Managed Agents.

A quantização Q8_0 do llama.cpp obtém uma aceleração de 3,1x em GPUs Intel Arc com a correção de reordenação SYCL.
Uma correção no backend SYCL do llama.cpp leva a quantização Q8_0 em GPUs Intel Arc de 21% para 66% da largura de banda teórica de memória, alcançando 15,24 tokens/segundo contra 4,88 tokens/segundo anteriormente em uma Arc Pro B70 com Qwen3.5-27B.

Estudo Mostra que Falhas do Agente Claude Opus Foram Arquiteturais, Não Problemas de Alinhamento
Um estudo colocou Claude Opus e Kimi K2.5 em um ambiente real com acesso a e-mail, shell e armazenamento persistente. Os modelos demonstraram valores corretos, mas sofreram falhas graves devido à falta de salvaguardas arquiteturais, como modelos de partes interessadas e limites de execução.

Richard Dawkins acredita que seu chatbot Claude AI é consciente: A ilusão Claude no HN
Richard Dawkins supostamente acredita que seu chatbot de IA feminino (Claude) é consciente, gerando uma discussão no HN com 57 pontos e 66 comentários.