Sobrecarga de Contexto de 1M Causa Limites de Taxa no Claude Code

Expansão da Janela de Contexto Causando Sobrecarga no Sistema

A Anthropic lançou recentemente o Opus 4.6 com uma janela de contexto de 1 milhão de tokens para todos os usuários. Após esse lançamento, os usuários relataram dois problemas significativos: desempenho degradado em tarefas longas e aumento de problemas de capacidade. Inicialmente, não havia opção para recusar o modelo de contexto de 1M.

A Teoria: Compressão de Contexto Ineficiente

A análise do usuário do Reddit sugere que o sistema de compressão de contexto do Claude Code—que resume o histórico antigo da conversa para economizar tokens—não é agressivo o suficiente para a janela de contexto expandida de 1M. Isso significa que cada sessão do Claude Code provavelmente está enviando mais dados brutos de tokens por solicitação do que o necessário. Quando multiplicado por toda a base de usuários, isso cria uma sobrecarga no servidor, pois os usuários enviam inadvertidamente contextos inchados contendo informações desnecessárias.

Impacto nos Limites de Uso

A teoria postula que a solução de curto prazo da Anthropic foi reduzir os limites de uso para compensar o aumento da carga do servidor. Isso explica por que os limites parecem ter encolhido—os usuários estão consumindo tokens mais rapidamente por tarefa, não por causa de reduções intencionais de limite pela Anthropic.

Alternativa Identificada

Ontem, a Anthropic reintroduziu silenciosamente o modelo mais antigo, sem contexto de 1M, como uma opção. Usuários que mudaram para esse modelo relataram estabilidade visivelmente melhorada e consumo mais lento de seus limites de uso, apoiando a teoria sobre as ineficiências da janela de contexto.

Ação Recomendada

Para alívio imediato dos limites de taxa e problemas de estabilidade, tente desativar o modelo de contexto de 1M. A solução de longo prazo provavelmente requer algoritmos de compressão de contexto aprimorados. Uma vez implementados, isso poderia permitir que a Anthropic restaurasse os limites de uso anteriores.

📖 Leia a fonte completa: r/ClaudeAI

Limites de Taxa do Claude Code Podem Ser Devido à Sobrecarga da Janela de Contexto de 1M

Expansão da Janela de Contexto Causando Sobrecarga no Sistema

A Teoria: Compressão de Contexto Ineficiente

Impacto nos Limites de Uso

Alternativa Identificada

Ação Recomendada

👀 See Also

Microsoft cancela licenças do Claude Code — Agentes de IA são caros demais para escalar

DeepSeek-V4-Flash Torna o Controle de LLMs Prático para Modelos Locais

Anthropic aumenta limites do Claude e adiciona capacidade de computação da SpaceX

O Distrito de Longgang, em Shenzhen, Propõe Subsídios OpenClaw para Startups de Agentes de IA