O limite de taxa não documentado do pool OAuth da Anthropic requer o prompt do sistema Claude Code

Um desenvolvedor que construía um proxy de LLM descobriu que o tratamento de limite de taxa da Anthropic para tokens OAuth depende do conteúdo do prompt do sistema, não dos cabeçalhos ou do tipo de token.
O problema
O desenvolvedor tinha uma configuração funcional com:
- SDK da Anthropic com authToken
- Cabeçalhos beta (claude-code-20250219, oauth-2025-04-20)
- user-agent: claude-cli/2.1.75
- x-app: cli
Haiku funcionou bem, mas Sonnet retornou persistentes erros de limite de taxa 429 sem cabeçalho retry-after, sem cabeçalhos de limite de taxa, apenas "message": "Error". Enquanto isso, um agente de IA (executando OpenClaw) no mesmo servidor com o mesmo token OAuth não teve problemas com o Sonnet 4.6.
A solução
Após examinar o código-fonte do provedor da Anthropic do OpenClaw (@mariozechner/pi-ai), o desenvolvedor encontrou este código:
// Para tokens OAuth, DEVEMOS incluir a identidade do Claude Code
if (isOAuthToken) {
params.system = [{
type: "text",
text: "You are Claude Code, Anthropic's official CLI for Claude.",
}];
}
Adicionar esta única linha ao proxy corrigiu imediatamente os erros de limite de taxa do Sonnet.
Como funciona
A API direciona as solicitações para o pool de limite de taxa do Claude Code (que é separado e maior que o pool regular da API) com base em se seu prompt do sistema se identifica como Claude Code. Este comportamento não está documentado na documentação do SDK ou da API.
Correção prática
Se você está usando tokens OAuth da Anthropic e recebendo erros 429 misteriosos, adicione "You are Claude Code, Anthropic's official CLI for Claude." ao seu prompt do sistema.
📖 Read the full source: r/ClaudeAI
👀 See Also

Gerenciando o Consumo de Tokens do Claude AI: Dicas Práticas da Experiência de Desenvolvedores
Um desenvolvedor relata ter consumido 94.000 tokens em 3 minutos usando o recurso Explore do Claude, resultando em limitação de taxa por 4 horas, e compartilha estratégias concretas incluindo manter um arquivo ARCHITECTURE.md e usar prompts cirúrgicos para controlar o uso de tokens.

O Método da Sogra: Usando a Amabilidade de Claude para Revisões de Código Brutais
Um usuário do Reddit engana o Claude para fazer revisões de código severas, enquadrando o código como escrito por uma sogra odiada, resultando em 27 problemas encontrados em 4 agentes revisores hostis após 31 minutos de análise profunda.

Melhorias na estrutura do prompt para execução confiável de habilidades de IA
Um desenvolvedor compartilha duas modificações-chave no prompt que permitiram que sua habilidade de análise de mercado funcionasse de ponta a ponta sem intervenção manual: separar explicitamente o que a habilidade deve retornar versus o que deve fazer, e definir condições explícitas de falha para evitar improvisações.

Claude Code Modo Headless com o Flag --print
O Claude Code pode ser executado em modo headless usando a flag --print, permitindo que prompts sejam canalizados para saída automatizada sem sessões interativas. Isso possibilita a integração em pipelines de CI/CD, hooks do git e scripts bash.