Claude Code : 45K Jetons Cachés par Session, Solution ENABLE_TOOL

Une enquête sur le gaspillage de jetons révèle une surcharge significative

Un développeur a réalisé un audit de 926 sessions de Claude Code après avoir constaté une consommation rapide de jetons suite aux changements de limites de taux d'Anthropic. L'enquête a révélé que chaque session de Claude Code commence avec une charge utile de base d'environ 45 000 jetons avant toute saisie utilisateur. Cela inclut les invites système, les définitions d'outils, les descriptions d'agents, les fichiers de mémoire, les descriptions de compétences et les schémas MCP.

Sur la fenêtre de contexte standard de 200k, cette charge de départ de 45k représente plus de 20 % du contexte disponible consommé avant même que la conversation ne commence. Comme Claude Code fonctionne en boucle sans état, tout ce contexte est reconstruit et renvoyé à chaque tour, ce qui rend la surcharge de départ un coût récurrent.

Le chargement par défaut des outils consomme beaucoup de jetons

L'audit a révélé que 20 000 jetons du contexte de départ provenaient des définitions de schémas d'outils système. Par défaut, Claude Code charge le schéma JSON complet de chaque outil disponible dans le contexte au début de la session, qu'ils soient utilisés ou non.

Le développeur a découvert un paramètre appelé enable_tool_search qui permet un chargement différé des outils. Lorsqu'il est activé, ce paramètre ne charge que 6 outils principaux initialement et charge les autres à la demande au lieu de tout déverser d'un coup.

Un changement de configuration génère des économies immédiates

Pour activer le chargement différé des outils, ajoutez ceci à votre settings.json :

{
  "env": {
    "ENABLE_TOOL_SEARCH": "true"
  }
}

Ce simple changement de configuration a réduit le contexte de départ de 45 000 à 20 000 jetons, la surcharge des outils système passant de 20 000 à 6 000 jetons. Cela économise 14 000 jetons à chaque tour de chaque session.

Implications financières des paramètres par défaut

Le développeur a calculé l'impact de ce paramètre sur son utilisation. Avec des sessions d'en moyenne 22 tours, les 14 000 jetons supplémentaires par tour représentaient 308 000 jetons inutiles par session. Sur 858 sessions, cela totalisait 264 millions de jetons.

Au tarif de lecture du cache (0,50 $/MTok), cela représentait 132 $ de coûts inutiles. Cependant, comme plus de la moitié des tours touchaient des caches expirés (ce qui déclenche le tarif complet d'entrée à 5 $/MTok), le coût réel a été estimé entre 132 $ et 1 300 $ pour ce seul paramètre par défaut.

Stratégies d'optimisation supplémentaires

Le développeur a également mis en œuvre d'autres optimisations qui ont réduit le contexte de départ de 4 000 à 5 000 jetons :

Réduction et remaniement des fichiers markdown et de mémoire CLAUDE
Consolidation des descriptions de compétences
Désactivation des serveurs MCP inutilisés
Réduction des injections de schémas provenant des crochets de mémoire

Claude Code stocke les conversations sous forme de fichiers JSONL localement dans ~/.claude/projects/, bien qu'il n'existe aucun moyen intégré d'obtenir des ventilations détaillées par session, de coût par projet ou de catégories de dépenses. La commande intégrée /insights s'est avérée insuffisante pour diagnostiquer le gaspillage.

📖 Lire la source complète : r/ClaudeAI

L'audit des jetons de Claude Code révèle des coûts cachés dus au chargement par défaut des outils.

Une enquête sur le gaspillage de jetons révèle une surcharge significative

Le chargement par défaut des outils consomme beaucoup de jetons

Un changement de configuration génère des économies immédiates

Implications financières des paramètres par défaut

Stratégies d'optimisation supplémentaires

👀 See Also

Correcteur de proxy Discord OpenClaw pour les problèmes de délai d'expiration de l'API REST

La commande /insights de Claude Code offre des conseils de débogage et des astuces pour les tâches autonomes.

Modèle AGENTS.md pour React Native : Claude Code génère un code plus conscient du projet

Gonflement des tokens dans les cadres d'agents : un ratio entrée-sortie de 500:1 est normal