Efficacité des tokens Opus 4.7 : les prompts en allemand consomment jusqu'à 2x plus de tokens que l'anglais

Le tokeniseur de Claude présente un biais linguistique connu, et un article récent sur r/ClaudeAI démontre l'impact réel de l'utilisation de langues non anglaises avec le modèle Opus 4.7.
Le problème
Un abonné Pro a exécuté une invite d'analyse boursière (prévisions pour The Trade Desk, Coreweave, Cloudflare) d'abord en anglais, puis en allemand. Résultats :
- Anglais (Opus 4.7 Extended) : a consommé 37 % des jetons de session
- Anglais (Opus 4.6) : 33 %
- Anglais (Sonnet) : ~28 %
- Allemand (Opus 4.7) : 100 % en quelques secondes
La même invite en allemand avec le même modèle a épuisé la limite de session presque instantanément.
Pourquoi cela se produit
Claude tokenise le texte. L'anglais utilise en moyenne ~1 jeton pour 0,75 mot ; l'allemand utilise ~1 jeton pour 0,5 mot — parfois pire. Les noms composés comme Aktienmarktanalyse sont divisés en plus de jetons que stock market analysis, et les umlauts ainsi qu'une couverture moindre des données d'entraînement augmentent les décomptes. Pour un contenu sémantique équivalent, une invite + réponse en allemand peut consommer 1,5 à 2 fois plus de jetons que l'anglais.
Solutions de contournement
Le modèle lui-même suggère deux atténuations :
- Formuler l'invite en allemand mais demander des réponses en anglais — par exemple, les étiquettes de feuille de calcul restent en anglais tandis que la conversation reste en allemand
- Demander au modèle d'être plus concis pour réduire le nombre de jetons de sortie
Anthropic est conscient du problème du coût multilingue des jetons, mais il s'agit d'une propriété structurelle du tokeniseur — qui ne peut pas être corrigée côté client.
À retenir
Si vous utilisez Claude dans une langue autre que l'anglais et que vous atteignez les limites de session, c'est probablement la raison. Pour les workflows lourds (appels d'outils, recherches web, longues sorties), envisagez de passer à l'anglais pour la sortie afin d'économiser des jetons.
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude Code 2.1.132 : Documentation multi-agents, porte de planification, changements de limite de compétences
La version v2.1.132 ajoute la documentation des agents gérés pour les sessions multi-agents, les résultats et les webhooks ; introduit une porte de refus par défaut pour les offres proactives /schedule ; réduit la limite de compétences documentée de 64 à 20 par agent.

Règlement du SDNY rejetant le privilège avocat-client pour les communications par IA
Le juge Rakoff a statué dans l'affaire U.S. v. Heppner que les communications avec des outils d'IA comme ChatGPT ne bénéficient pas du secret professionnel avocat-client, exigeant la divulgation de tout travail juridique généré par l'IA. Le tribunal a estimé que l'IA manque de la confidentialité humaine requise pour la protection du secret professionnel.

Zombification des universités par l'IA : Témoignage direct de la triche par LLM dans les grandes écoles
Une analyse de la manière dont les LLM détruisent systématiquement l'intégrité académique dans les universités d'élite, avec des exemples concrets de l'UChicago : des écarts de 40 points entre les examens à emporter et les examens en présentiel, des étudiants photographiant les épreuves pendant les tests, et des professeurs rédigeant leurs cours avec ChatGPT.

L'IA ne parvient pas à stimuler la productivité selon une récente étude de PDG
Malgré l'adoption généralisée de l'IA, une étude portant sur 6 000 cadres dirigeants rapporte des impacts négligeables sur la productivité et l'emploi, faisant écho au paradoxe de la productivité identifié à l'ère des technologies de l'information dans les années 1980.