L'audit des jetons de Claude Code révèle des coûts cachés dus au chargement par défaut des outils.

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
L'audit des jetons de Claude Code révèle des coûts cachés dus au chargement par défaut des outils.
Ad

Une enquête sur le gaspillage de jetons révèle une surcharge significative

Un développeur a réalisé un audit de 926 sessions de Claude Code après avoir constaté une consommation rapide de jetons suite aux changements de limites de taux d'Anthropic. L'enquête a révélé que chaque session de Claude Code commence avec une charge utile de base d'environ 45 000 jetons avant toute saisie utilisateur. Cela inclut les invites système, les définitions d'outils, les descriptions d'agents, les fichiers de mémoire, les descriptions de compétences et les schémas MCP.

Sur la fenêtre de contexte standard de 200k, cette charge de départ de 45k représente plus de 20 % du contexte disponible consommé avant même que la conversation ne commence. Comme Claude Code fonctionne en boucle sans état, tout ce contexte est reconstruit et renvoyé à chaque tour, ce qui rend la surcharge de départ un coût récurrent.

Le chargement par défaut des outils consomme beaucoup de jetons

L'audit a révélé que 20 000 jetons du contexte de départ provenaient des définitions de schémas d'outils système. Par défaut, Claude Code charge le schéma JSON complet de chaque outil disponible dans le contexte au début de la session, qu'ils soient utilisés ou non.

Le développeur a découvert un paramètre appelé enable_tool_search qui permet un chargement différé des outils. Lorsqu'il est activé, ce paramètre ne charge que 6 outils principaux initialement et charge les autres à la demande au lieu de tout déverser d'un coup.

Un changement de configuration génère des économies immédiates

Pour activer le chargement différé des outils, ajoutez ceci à votre settings.json :

{
  "env": {
    "ENABLE_TOOL_SEARCH": "true"
  }
}

Ce simple changement de configuration a réduit le contexte de départ de 45 000 à 20 000 jetons, la surcharge des outils système passant de 20 000 à 6 000 jetons. Cela économise 14 000 jetons à chaque tour de chaque session.

Ad

Implications financières des paramètres par défaut

Le développeur a calculé l'impact de ce paramètre sur son utilisation. Avec des sessions d'en moyenne 22 tours, les 14 000 jetons supplémentaires par tour représentaient 308 000 jetons inutiles par session. Sur 858 sessions, cela totalisait 264 millions de jetons.

Au tarif de lecture du cache (0,50 $/MTok), cela représentait 132 $ de coûts inutiles. Cependant, comme plus de la moitié des tours touchaient des caches expirés (ce qui déclenche le tarif complet d'entrée à 5 $/MTok), le coût réel a été estimé entre 132 $ et 1 300 $ pour ce seul paramètre par défaut.

Stratégies d'optimisation supplémentaires

Le développeur a également mis en œuvre d'autres optimisations qui ont réduit le contexte de départ de 4 000 à 5 000 jetons :

  • Réduction et remaniement des fichiers markdown et de mémoire CLAUDE
  • Consolidation des descriptions de compétences
  • Désactivation des serveurs MCP inutilisés
  • Réduction des injections de schémas provenant des crochets de mémoire

Claude Code stocke les conversations sous forme de fichiers JSONL localement dans ~/.claude/projects/, bien qu'il n'existe aucun moyen intégré d'obtenir des ventilations détaillées par session, de coût par projet ou de catégories de dépenses. La commande intégrée /insights s'est avérée insuffisante pour diagnostiquer le gaspillage.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Correcteur de proxy Discord OpenClaw pour les problèmes de délai d'expiration de l'API REST
Tips

Correcteur de proxy Discord OpenClaw pour les problèmes de délai d'expiration de l'API REST

Un utilisateur signale avoir résolu des problèmes de connexion Discord avec OpenClaw où le WebSocket se connecte mais les appels d'API REST échouent avec des erreurs "fetch failed UND_ERR_CONNECT_TIMEOUT". La solution implique la création d'un fichier proxy-preload.cjs et la configuration des paramètres de proxy global undici.

OpenClawRadar
La commande /insights de Claude Code offre des conseils de débogage et des astuces pour les tâches autonomes.
Tips

La commande /insights de Claude Code offre des conseils de débogage et des astuces pour les tâches autonomes.

Un utilisateur de Reddit partage deux techniques pratiques pour utiliser la commande /insights de Claude Code : demander au moins trois causes potentielles lors du débogage de bugs, et utiliser des spécifications de tâches complètes avec --dangerously-skip-permissions pour des exécutions autonomes.

OpenClawRadar
Modèle AGENTS.md pour React Native : Claude Code génère un code plus conscient du projet
Tips

Modèle AGENTS.md pour React Native : Claude Code génère un code plus conscient du projet

Un utilisateur de Reddit partage son fichier AGENTS.md pour les projets React Native/Expo, qui inclut la structure des dossiers, les tokens de thème, les hooks personnalisés et les patterns de composants. Résultat : Claude Code et Cursor génèrent du code utilisant les conventions exactes du projet au lieu du code React Native générique.

OpenClawRadar
Gonflement des tokens dans les cadres d'agents : un ratio entrée-sortie de 500:1 est normal
Tips

Gonflement des tokens dans les cadres d'agents : un ratio entrée-sortie de 500:1 est normal

Un utilisateur d'un framework d'agents auto-hébergé rapporte environ 21k tokens d'entrée par message et un ratio entrée/sortie de 500:1 dû aux définitions d'outils, au prompt système et à la mémoire. La communauté confirme qu'un contexte de base de 15 à 25k tokens est courant pour les agents utilisant des outils.

OpenClawRadar