Correction du Gaspillage de Jetons Claude Code : Désactiver l'En-tête d'Attribution pour de Meilleurs Résultats de Cache

✍️ OpenClawRadar📅 Publié: April 1, 2026🔗 Source
Correction du Gaspillage de Jetons Claude Code : Désactiver l'En-tête d'Attribution pour de Meilleurs Résultats de Cache
Ad

Claude Code gaspille des tokens à chaque nouvelle session depuis la version 2.1.69 à cause d'un en-tête d'attribution de facturation qui casse la mise en cache des invites. Le problème est documenté dans plusieurs issues GitHub (#40652, #34629, #40524) sans réponse officielle d'Anthropic à la date de publication de la source.

Ce qui se passe

Depuis la v2.1.69, Claude Code insère une chaîne d'attribution de facturation dans le premier bloc de votre invite système : x-anthropic-billing-header: cc_version=2.1.88.a3f; cc_entrypoint=cli; cch=00000;

La partie .a3f est un hachage de 3 caractères calculé à partir de votre premier message dans chaque conversation en utilisant cette fonction :

function computeHash(firstUserMessage, version) {
  const chars = [4, 7, 20].map(i => firstUserMessage[i] || "0").join("");
  return sha256("59cf53e54c78" + chars + version).slice(0, 3);
}

Différentes conversations avec des premiers messages différents génèrent des hachages différents à chaque fois.

Pourquoi cela casse la mise en cache

La mise en cache d'Anthropic nécessite des segments d'invite 100% identiques. Le cache est partagé dans toute votre Organisation ou Espace de travail, pas par session. L'en-tête de facturation se trouve au début de l'invite système d'environ 23K tokens, et comme il change par conversation, le préfixe ne correspond jamais, provoquant des échecs de cache à chaque nouveau chat.

Ad

Résultats de benchmark

Un test A/B contrôlé a montré :

  • En-tête ACTIVÉ (par défaut) : Taux de succès du cache de 48%, ~12K tokens reconstruits par session
  • En-tête DÉSACTIVÉ : Taux de succès du cache de 99,98%, aucune création de cache sur 3 sessions sur 4

Le résultat est 7x moins cher par session sur le traitement des invites système.

La solution

Ajoutez ceci à votre configuration shell :

export CLAUDE_CODE_ATTRIBUTION_HEADER=false

Pour les utilisateurs de zsh :

echo 'export CLAUDE_CODE_ATTRIBUTION_HEADER=false' >> ~/.zshrc
source ~/.zshrc

Les nouvelles sessions le prennent automatiquement en compte. Les sessions existantes n'ont pas besoin d'être redémarrées—le hachage ne change pas en cours de conversation, et elles n'interfèrent pas avec les nouvelles sessions.

Sécurité et contexte

Ce n'est pas un hack—la variable d'environnement existe dans le code source comme une bascule de fonctionnalité appropriée. claude-code-router et CLIProxyAPI ont été livrés avec ceci désactivé en production sans problèmes signalés.

Anthropic a probablement implémenté ceci pour suivre quelle version et point d'entrée (CLI vs SDK vs GitHub Action) a effectué chaque appel API, le plaçant dans l'invite système car Bedrock/Vertex ne transmettent pas les en-têtes personnalisés.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Arrêtez de brûler des tokens Claude Code pour des questions de chat
Tips

Arrêtez de brûler des tokens Claude Code pour des questions de chat

Un développeur sur r/ClaudeAI a économisé son quota de tokens hebdomadaire en routant les questions de chat simples vers des modèles bon marché comme Haiku, réservant Claude Code pour les tâches d'agent comme les modifications multi-fichiers.

OpenClawRadar
Cinq erreurs courantes de configuration d'OpenClaw qui gaspillent de l'argent et créent des risques de sécurité
Tips

Cinq erreurs courantes de configuration d'OpenClaw qui gaspillent de l'argent et créent des risques de sécurité

Après avoir examiné plus de 50 configurations OpenClaw, les mêmes cinq problèmes réapparaissent constamment : utiliser Opus comme modèle par défaut au lieu de Sonnet pour la plupart des tâches, ne jamais démarrer de nouvelles sessions, installer des compétences sans lire le code source, exposer la passerelle au réseau, et ajouter un deuxième agent avant de réparer le premier.

OpenClawRadar
La tendance de Claude Code à valider des hypomèses erronées et à suggérer des contournements
Tips

La tendance de Claude Code à valider des hypomèses erronées et à suggérer des contournements

Un développeur rapporte que Claude Code mettra en œuvre avec enthousiasme des architectures défectueuses sans remettre en question des hypothèses incorrectes, ce qui entraîne une perte de temps de débogage. La solution consiste à ajouter explicitement « suppose que je puisse me tromper sur le cadrage » aux demandes complexes.

OpenClawRadar
Instructions personnalisées essentielles pour Claude afin d'éviter les désagréments courants
Tips

Instructions personnalisées essentielles pour Claude afin d'éviter les désagréments courants

Un utilisateur de Reddit partage trois instructions personnalisées spécifiques pour résoudre les irritations courantes de Claude : exiger des avertissements avant les commandes destructrices, empêcher les changements de plan en cours de réponse et réserver les blocs de code exclusivement au code fonctionnel.

OpenClawRadar