Désactiver l'En-tête d'Attribution Claude Code : Cache +99.98%

Claude Code gaspille des tokens à chaque nouvelle session depuis la version 2.1.69 à cause d'un en-tête d'attribution de facturation qui casse la mise en cache des invites. Le problème est documenté dans plusieurs issues GitHub (#40652, #34629, #40524) sans réponse officielle d'Anthropic à la date de publication de la source.

Ce qui se passe

Depuis la v2.1.69, Claude Code insère une chaîne d'attribution de facturation dans le premier bloc de votre invite système : x-anthropic-billing-header: cc_version=2.1.88.a3f; cc_entrypoint=cli; cch=00000;

La partie .a3f est un hachage de 3 caractères calculé à partir de votre premier message dans chaque conversation en utilisant cette fonction :

function computeHash(firstUserMessage, version) {
  const chars = [4, 7, 20].map(i => firstUserMessage[i] || "0").join("");
  return sha256("59cf53e54c78" + chars + version).slice(0, 3);
}

Différentes conversations avec des premiers messages différents génèrent des hachages différents à chaque fois.

Pourquoi cela casse la mise en cache

La mise en cache d'Anthropic nécessite des segments d'invite 100% identiques. Le cache est partagé dans toute votre Organisation ou Espace de travail, pas par session. L'en-tête de facturation se trouve au début de l'invite système d'environ 23K tokens, et comme il change par conversation, le préfixe ne correspond jamais, provoquant des échecs de cache à chaque nouveau chat.

Résultats de benchmark

Un test A/B contrôlé a montré :

En-tête ACTIVÉ (par défaut) : Taux de succès du cache de 48%, ~12K tokens reconstruits par session
En-tête DÉSACTIVÉ : Taux de succès du cache de 99,98%, aucune création de cache sur 3 sessions sur 4

Le résultat est 7x moins cher par session sur le traitement des invites système.

La solution

Ajoutez ceci à votre configuration shell :

export CLAUDE_CODE_ATTRIBUTION_HEADER=false

Pour les utilisateurs de zsh :

echo 'export CLAUDE_CODE_ATTRIBUTION_HEADER=false' >> ~/.zshrc
source ~/.zshrc

Les nouvelles sessions le prennent automatiquement en compte. Les sessions existantes n'ont pas besoin d'être redémarrées—le hachage ne change pas en cours de conversation, et elles n'interfèrent pas avec les nouvelles sessions.

Sécurité et contexte

Ce n'est pas un hack—la variable d'environnement existe dans le code source comme une bascule de fonctionnalité appropriée. claude-code-router et CLIProxyAPI ont été livrés avec ceci désactivé en production sans problèmes signalés.

Anthropic a probablement implémenté ceci pour suivre quelle version et point d'entrée (CLI vs SDK vs GitHub Action) a effectué chaque appel API, le plaçant dans l'invite système car Bedrock/Vertex ne transmettent pas les en-têtes personnalisés.

📖 Lire la source complète : r/ClaudeAI

Correction du Gaspillage de Jetons Claude Code : Désactiver l'En-tête d'Attribution pour de Meilleurs Résultats de Cache

Ce qui se passe

Pourquoi cela casse la mise en cache

Résultats de benchmark

La solution

Sécurité et contexte

👀 See Also

Un bon développement assisté par l'IA se produit au niveau des systèmes, pas au niveau des tâches

Intégrez les résumés de projet de Claude dans votre dépôt — ils surpassent la documentation humaine

8 mois d'utilisation quotidienne de Claude : 9 astuces pratiques (hors programmation)

Conseils utiles de la communauté OpenClaw : Une exploration approfondie de l'optimisation des agents IA