O limite de taxa não documentado do pool OAuth da Anthropic requer o prompt do sistema Claude Code

✍️ OpenClawRadar📅 Publicado: April 13, 2026🔗 Source

Um desenvolvedor que construía um proxy de LLM descobriu que o tratamento de limite de taxa da Anthropic para tokens OAuth depende do conteúdo do prompt do sistema, não dos cabeçalhos ou do tipo de token.

O problema

O desenvolvedor tinha uma configuração funcional com:

SDK da Anthropic com authToken
Cabeçalhos beta (claude-code-20250219, oauth-2025-04-20)
user-agent: claude-cli/2.1.75
x-app: cli

Haiku funcionou bem, mas Sonnet retornou persistentes erros de limite de taxa 429 sem cabeçalho retry-after, sem cabeçalhos de limite de taxa, apenas "message": "Error". Enquanto isso, um agente de IA (executando OpenClaw) no mesmo servidor com o mesmo token OAuth não teve problemas com o Sonnet 4.6.

A solução

Após examinar o código-fonte do provedor da Anthropic do OpenClaw (@mariozechner/pi-ai), o desenvolvedor encontrou este código:

// Para tokens OAuth, DEVEMOS incluir a identidade do Claude Code
if (isOAuthToken) {
    params.system = [{
        type: "text",
        text: "You are Claude Code, Anthropic's official CLI for Claude.",
    }];
}

Adicionar esta única linha ao proxy corrigiu imediatamente os erros de limite de taxa do Sonnet.

Como funciona

A API direciona as solicitações para o pool de limite de taxa do Claude Code (que é separado e maior que o pool regular da API) com base em se seu prompt do sistema se identifica como Claude Code. Este comportamento não está documentado na documentação do SDK ou da API.

Correção prática

Se você está usando tokens OAuth da Anthropic e recebendo erros 429 misteriosos, adicione "You are Claude Code, Anthropic's official CLI for Claude." ao seu prompt do sistema.

📖 Read the full source: r/ClaudeAI

👀 See Also

Tips

Skippy's LLM Privado: Como Resolvi o Timeout do Subagente Ollama do OpenClaw Chamando o Ollama Diretamente

Assistente de IA de um COO da OC contorna o sistema de subagentes quebrado do OpenClaw chamando uma segunda instância do Ollama diretamente via curl. Sem gateway, sem bloqueio do loop de eventos.

Jun 19, 2026, 12:18 PM UTC

OpenClawRadar

Tips

Corrigir Ollama Cloud Model maxTokens: Limite é 16K, não valor configuração

O Ollama cloud limita a saída em 16.384 tokens, independentemente da configuração de maxTokens. Defina para 14.000 para evitar erros de EOF. Reestruture saídas longas ou direcione para o provedor direto.

Jun 3, 2026, 12:17 PM UTC

OpenClawRadar

Tips

Depuração do Loop de Falha do OpenClaw: Uma Lista de Verificação de 5 Pontos

Uma postagem do Reddit no r/openclaw fornece uma lista de verificação de cinco etapas para diagnosticar rapidamente loops de travamento em agentes ou gateways do OpenClaw, focando na forma da falha, pressão no host, latência do provedor, diferenças de configuração e configuração de alertas.

Mar 22, 2026, 05:45 PM UTC

OpenClawRadar

Tips

Drenagem de Orçamento da API OpenClaw: Configurações para Alterar Imediatamente

O recurso Heartbeat padrão do OpenClaw pode esgotar os orçamentos de API ao verificar tarefas a cada 30 minutos e carregar arquivos de contexto completos, memória e histórico de conversa cada vez. A fonte recomenda alterar as Horas Ativas, usar modelos base mais baratos, mudar manualmente para modelos premium apenas quando necessário e usar /new para redefinir sessões.

Mar 20, 2026, 09:45 PM UTC

OpenClawRadar