Opus 4.7 : prompts allemands 2x plus de tokens qu'en anglais

Le tokeniseur de Claude présente un biais linguistique connu, et un article récent sur r/ClaudeAI démontre l'impact réel de l'utilisation de langues non anglaises avec le modèle Opus 4.7.

Le problème

Un abonné Pro a exécuté une invite d'analyse boursière (prévisions pour The Trade Desk, Coreweave, Cloudflare) d'abord en anglais, puis en allemand. Résultats :

Anglais (Opus 4.7 Extended) : a consommé 37 % des jetons de session
Anglais (Opus 4.6) : 33 %
Anglais (Sonnet) : ~28 %
Allemand (Opus 4.7) : 100 % en quelques secondes

La même invite en allemand avec le même modèle a épuisé la limite de session presque instantanément.

Pourquoi cela se produit

Claude tokenise le texte. L'anglais utilise en moyenne ~1 jeton pour 0,75 mot ; l'allemand utilise ~1 jeton pour 0,5 mot — parfois pire. Les noms composés comme Aktienmarktanalyse sont divisés en plus de jetons que stock market analysis, et les umlauts ainsi qu'une couverture moindre des données d'entraînement augmentent les décomptes. Pour un contenu sémantique équivalent, une invite + réponse en allemand peut consommer 1,5 à 2 fois plus de jetons que l'anglais.

Solutions de contournement

Le modèle lui-même suggère deux atténuations :

Formuler l'invite en allemand mais demander des réponses en anglais — par exemple, les étiquettes de feuille de calcul restent en anglais tandis que la conversation reste en allemand
Demander au modèle d'être plus concis pour réduire le nombre de jetons de sortie

Anthropic est conscient du problème du coût multilingue des jetons, mais il s'agit d'une propriété structurelle du tokeniseur — qui ne peut pas être corrigée côté client.

À retenir

Si vous utilisez Claude dans une langue autre que l'anglais et que vous atteignez les limites de session, c'est probablement la raison. Pour les workflows lourds (appels d'outils, recherches web, longues sorties), envisagez de passer à l'anglais pour la sortie afin d'économiser des jetons.

📖 Read the full source: r/ClaudeAI

Efficacité des tokens Opus 4.7 : les prompts en allemand consomment jusqu'à 2x plus de tokens que l'anglais

Le problème

Pourquoi cela se produit

Solutions de contournement

À retenir

👀 See Also

Anthropic acquiert Stainless pour plus de 300 millions de dollars — possède désormais le générateur de serveur MCP dominant

Les affirmations du Royaume-Uni sur les investissements dans l'IA sous examen : des datacenters fantômes et des financements non vérifiés.

Le Composer 2.0 de Cursor semble utiliser le modèle Kimi 2.5, selon les preuves fournies par les points de terminaison d'API.

Claude Code v2.1.178 ajoute des règles de permission Tool(param:valeur), corrige des problèmes de sous-agent et d'authentification