El grupo de límite de tasa OAuth no documentado de Anthropic requiere el mensaje del sistema Claude Code

Un desarrollador que construía un proxy de LLM descubrió que el manejo del límite de tasa de Anthropic para tokens OAuth depende del contenido del prompt del sistema, no de los encabezados o tipo de token.
El problema
El desarrollador tenía una configuración funcional con:
- SDK de Anthropic con authToken
- Encabezados beta (claude-code-20250219, oauth-2025-04-20)
- user-agent: claude-cli/2.1.75
- x-app: cli
Haiku funcionaba bien, pero Sonnet devolvía persistentes errores 429 de límite de tasa sin encabezado retry-after, sin encabezados de límite de tasa, solo "message": "Error". Mientras tanto, un agente de IA (ejecutando OpenClaw) en el mismo servidor con el mismo token OAuth no tenía problemas con Sonnet 4.6.
La solución
Después de examinar el código fuente del proveedor de Anthropic de OpenClaw (@mariozechner/pi-ai), el desarrollador encontró este código:
// Para tokens OAuth, DEBEMOS incluir la identidad de Claude Code
if (isOAuthToken) {
params.system = [{
type: "text",
text: "You are Claude Code, Anthropic's official CLI for Claude.",
}];
}
Agregar esta línea al proxy resolvió inmediatamente los errores de límite de tasa de Sonnet.
Cómo funciona
La API dirige las solicitudes al grupo de límite de tasa de Claude Code (que es separado y más alto que el grupo regular de la API) según si tu prompt del sistema se identifica como Claude Code. Este comportamiento no está documentado en la documentación del SDK ni en la de la API.
Solución práctica
Si estás usando tokens OAuth de Anthropic y recibes misteriosos errores 429, agrega "You are Claude Code, Anthropic's official CLI for Claude." a tu prompt del sistema.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Usando Trabajos Cron de Contexto Ligero para Consejos Diarios de OpenClaw
Un usuario comparte su configuración de una tarea cron diaria que publica consejos de OpenClaw en un canal de Nextcloud Talk, destacando el flag --light-context para reducir la sobrecarga de arranque en tareas aisladas.

Un Flujo de Trabajo de IA en Dos Pasos para la Modernización de Código Heredado
Una publicación de Reddit describe un enfoque de 'ingeniería inversa' en dos pasos para usar IA con código heredado: primero extraer la lógica de negocio en un Documento de Requisitos de Negocio independiente de la tecnología, luego usar un prompt de 'Arquitecto Maestro' para reconstruir desde cero con las mejores prácticas modernas.

Usando el Patrón Dispatcher para Reducir los Costos de la API de Claude en un 95%
Un desarrollador redujo los costos de la API de Claude de $800-$2,000/mes a $215/mes implementando un patrón de despachador que delega el trabajo pesado a la CLI de Claude Code con una suscripción Max de $200/mes, con un costo de sobrecarga de la API de solo $5-15/mes.

Los Cron Jobs con Respaldo de IA Pueden Generar Costos Inesperados de API Cuando las Herramientas Se Bloquean
Un usuario reportó que un trabajo cron en OpenClaw que revisaba un buzón de correo cada 10 minutos usando himalaya consumió aproximadamente $60 en créditos de API cuando la conexión IMAP comenzó a colgarse, activando agentes de Claude en cada ejecución con tiempo de espera agotado a pesar de las instrucciones de solo involucrar IA para correos entrantes.