Usuários do Claude Code atingindo os limites de uso mais rápido que o esperado, suspeita-se de bugs

Problemas de cota do Claude Code interrompem fluxos de trabalho de desenvolvedores
A Anthropic confirmou que os usuários do Claude Code estão atingindo os limites de uso "muito mais rápido do que o esperado", causando interrupções em fluxos de trabalho automatizados e na codificação diária. A empresa afirma que esta é sua "principal prioridade" e que está investigando ativamente.
Relatos de usuários e reclamações específicas
Vários usuários em diferentes níveis de assinatura são afetados:
- Assinatura Claude Pro (US$ 200 anuais): "Ela atinge o máximo toda segunda-feira e reinicia no sábado... em 30 dias, consigo usar o Claude 12."
- Plano Max 5 (US$ 100/mês): "Usei o Max 5 em 1 hora de trabalho, antes eu conseguia trabalhar 8 horas."
Causas potenciais e detalhes técnicos
Vários fatores podem estar contribuindo para o aumento do uso de tokens:
- Reduções de cota durante horários de pico: A Anthropic recentemente reduziu as cotas durante horários de pico, afetando aproximadamente 7% dos usuários.
- Término da promoção: 28 de março foi o último dia de uma promoção do Claude que dobrou os limites de uso fora de uma janela de pico de seis horas.
- Bugs suspeitos no cache de prompts: Um usuário afirma ter encontrado "dois bugs independentes que fazem o cache de prompts quebrar, inflacionando silenciosamente os custos em 10 a 20 vezes" após fazer engenharia reversa do binário do Claude Code.
Soluções alternativas e otimização de cache
Alguns usuários encontraram soluções temporárias:
- Reverter para versão mais antiga: "Reverter para a versão 2.1.34 fez uma diferença muito perceptível."
- Limitações do cache de prompts: O cache tem apenas cinco minutos de duração por padrão, o que significa que pausas curtas resultam em custos mais altos ao retomar.
- Opção de cache estendido: Desenvolvedores podem atualizar a duração do cache para uma hora, mas "tokens de gravação de cache de 1 hora custam 2 vezes o preço dos tokens de entrada base". Tokens de leitura de cache custam 0,1 vezes o preço base.
Problemas de transparência e contexto mais amplo
A Anthropic não declara limites exatos de uso para seus planos:
- Plano Pro: "pelo menos cinco vezes mais uso por sessão em comparação com nosso serviço gratuito"
- Plano Team padrão: "1,25x mais uso por sessão do que o plano Pro"
Os usuários precisam verificar seu painel para monitorar o consumo da cota. Problemas semelhantes foram relatados no início deste mês com o Google Antigravity.
Impacto em fluxos de trabalho automatizados
Para desenvolvedores executando o Claude Code em fluxos de trabalho automatizados: "Erros de limite de taxa precisam ser capturados explicitamente – eles parecem falhas genéricas e acionarão silenciosamente novas tentativas. Uma sessão em loop pode esgotar seu orçamento diário em minutos."
📖 Read the full source: HN AI Agents
👀 See Also

OpenClaw perde acesso econômico aos modelos GPT e Claude
Os usuários do OpenClaw não podem mais usar os modelos da Anthropic sem pagar altas taxas de API, e a OpenAI reduziu severamente as cotas das contas Business e Teams para níveis próximos ao da camada gratuita, forçando os usuários a buscar alternativas chinesas ou modelos locais.

Equipe do MeshCore se divide: marca registrada em segredo, disputa sobre código gerado por IA
A equipe de desenvolvimento do MeshCore se divide publicamente após o colaborador Andy Kirby registrar secretamente a marca MeshCore e usar Claude Code para gerar a maioria de suas contribuições de código sem divulgação.
Benchmark de Esforço de Raciocínio do Opus 4.7: Médio Supera Alto e Máximo em Tarefas Reais
Em 29 tarefas do repositório GraphQL-go-tools, o Opus 4.7 no Claude Code atinge o pico com esforço de raciocínio médio — configurações mais altas degradam a correção e aumentam o custo sem melhorar a qualidade dos patches.

Modelo Local de 1,2B Supera Nuvens de 1T no Pôquer: Agressão Supera Conhecimento no Formato Shove-or-Fold
Um modelo Liquid de 1,2B venceu 2 de 5 torneios de Texas Hold'em contra modelos de até 1T de parâmetros, porque em um formato de stack curto, nunca desistir rendeu mais fichas do que jogo inteligente.