La limite de débit OAuth non documentée d'Anthropic nécessite un prompt système Claude Code

Un développeur créant un proxy LLM a découvert que la gestion des limites de débit d'Anthropic pour les jetons OAuth dépend du contenu du prompt système, pas des en-têtes ou du type de jeton.
Le problème
Le développeur avait une configuration fonctionnelle avec :
- SDK Anthropic avec authToken
- En-têtes bêta (claude-code-20250219, oauth-2025-04-20)
- user-agent : claude-cli/2.1.75
- x-app : cli
Haiku fonctionnait bien, mais Sonnet renvoyait des erreurs persistantes de limite de débit 429 sans en-tête retry-after, sans en-têtes de limite de débit, juste "message" : "Erreur". Pendant ce temps, un agent IA (exécutant OpenClaw) sur le même serveur avec le même jeton OAuth n'avait aucun problème avec Sonnet 4.6.
La solution
Après avoir examiné le code source du fournisseur Anthropic d'OpenClaw (@mariozechner/pi-ai), le développeur a trouvé ce code :
// Pour les jetons OAuth, nous DEVONS inclure l'identité Claude Code
if (isOAuthToken) {
params.system = [{
type: "text",
text: "You are Claude Code, Anthropic's official CLI for Claude.",
}];
}
Ajouter cette seule ligne au proxy a immédiatement résolu les erreurs de limite de débit Sonnet.
Comment cela fonctionne
L'API achemine les requêtes vers le pool de limites de débit Claude Code (qui est séparé et plus élevé que le pool API régulier) en fonction de si votre prompt système s'identifie comme Claude Code. Ce comportement n'est pas documenté dans la documentation du SDK ou de l'API.
Solution pratique
Si vous utilisez des jetons OAuth Anthropic et obtenez des erreurs 429 mystérieuses, ajoutez "You are Claude Code, Anthropic's official CLI for Claude." à votre prompt système.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

L'enquête sur l'utilisation des jetons OpenClaw révèle des problèmes de configuration.
Un développeur a épuisé son abonnement hebdomadaire OpenAI Codex en 1,5 jour et a utilisé Claude Code pour identifier des problèmes de configuration : des bots Telegram déclenchés sur chaque message, des récupérations web renvoyant du CSS/JS brut, et des fichiers de session orphelins qui s'accumulent.

Huit techniques de prompt qui améliorent la qualité des sorties de Claude
Un utilisateur de Reddit partage huit techniques de prompt spécifiques qui ont systématiquement amélioré la qualité de ses sorties Claude, incluant des commandes comme « Réfléchis à chaque niveau avant de répondre » et « Trouve les 20 % d'actions qui génèrent 80 % des résultats ».

Utiliser une incitation de type GAN pour améliorer la pensée critique de Claude
Un utilisateur de Reddit partage une phrase spécifique pour inciter Claude à adopter un cadre de pensée de type GAN, le forçant à critiquer et à tester en profondeur les idées au lieu de fournir des réponses superficielles et conciliantes.

Le bug du plugin Claude Code provoque le chargement en double des compétences, augmentant la compaction du contexte.
Un bug dans Claude Code provoque le chargement de chaque compétence deux fois en raison de répertoires de cache obsolètes et de la duplication de liens symboliques, augmentant considérablement la taille de l'invite système et déclenchant une compaction fréquente du contexte. La source fournit des scripts de vérification pour identifier le problème et des scripts de correction pour supprimer les versions obsolètes des plugins et les liens symboliques en double.