Gaspillage de tokens dans Claude Code : Un auto-audit utilisateur montre que les corrections comportementales surpassent le changement de modèle

✍️ OpenClawRadar📅 Publié: May 19, 2026🔗 Source
Gaspillage de tokens dans Claude Code : Un auto-audit utilisateur montre que les corrections comportementales surpassent le changement de modèle
Ad

Un utilisateur de Reddit a passé une semaine à mesurer où allaient réellement leurs tokens Claude Code, au lieu de simplement se plaindre des changements de prix de mai. Leur conclusion : la plupart des brûlures étaient auto-infligées, et des changements de comportement ont récupéré plus de marge que le changement de modèle n'aurait permis.

Ad

Plus grands gains

  • /clear entre tâches non liées — un contexte obsolète de 200k tokens traînant pour une correction d'une ligne était l'habitude la plus coûteuse.
  • Faites-lui planifier avant de toucher aux fichiers. Une passe de planification, puis exécutez — moins cher et meilleur qu'une boucle explorer-modifier-explorer.
  • Arrêtez de le laisser relire les fichiers qu'il vient de modifier. S'il vient de modifier un fichier, il n'a pas besoin de le rouvrir pour « vérifier ». Dites-le une fois dans vos règles.
  • Recherchez avec un sous-agent, pas le fil principal. Grep-et-lire dans un dépôt déverse toute la botte de foin dans votre contexte principal de façon permanente. Un sous-agent ne retourne que la réponse.
  • Supprimez les boucles toujours actives et -p que vous ne surveillez pas. Les agents en arrière-plan brûlant des tokens pendant que vous dormez sont la majorité des factures cauchemardesques.

Aucune de ces corrections n'a nécessité un nouvel abonnement, un wrapper ou un serveur MCP. C'était de la discipline que l'utilisateur admet avoir été trop paresseux pour appliquer quand les limites semblaient infinies.

Le post reconnaît que rien de tout cela ne résout les hausses de prix réelles — cela vous empêche simplement de brûler des tokens supplémentaires par-dessus.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

La commande /btw de Claude permet une communication parallèle pendant les tâches
Tips

La commande /btw de Claude permet une communication parallèle pendant les tâches

Claude AI prend désormais en charge une commande /btw qui permet aux utilisateurs de communiquer avec l'IA pendant qu'elle travaille activement sur une tâche, permettant de poser des questions, donner des instructions supplémentaires ou des clarifications sans interrompre le flux de travail en cours.

OpenClawRadar
Correction du délai d'attente OpenClaw LLM pour le chargement de modèle à froid
Tips

Correction du délai d'attente OpenClaw LLM pour le chargement de modèle à froid

Un utilisateur de Reddit a identifié et corrigé un problème de délai d'attente spécifique dans OpenClaw où les LLM locaux chargés à froid échouaient au bout d'environ 60 secondes, même avec des délais d'attente généraux plus élevés définis. La solution implique d'ajuster la configuration du délai d'attente d'inactivité du LLM de l'embedded-runner.

OpenClawRadar
Claude Prompt pour Visualiser la Structure de la Pensée : Intention, Réalité, Écart
Tips

Claude Prompt pour Visualiser la Structure de la Pensée : Intention, Réalité, Écart

Un utilisateur de Reddit partage une invite de 100 mots pour Claude qui demande à l'IA de remarquer et de refléter les schémas structurels de la conversation — catégorisés en Intention (ce que vous VOULEZ), Réalité (ce qui EST) et Écart (ce qui est NON RÉSOLU) — plutôt que le contenu lui-même.

OpenClawRadar
Taux d’acceptation MTP : le seuil de 50 % détermine le bénéfice du décodage spéculatif
Tips

Taux d’acceptation MTP : le seuil de 50 % détermine le bénéfice du décodage spéculatif

La MTP (prédiction multi-tokens) via décodage spéculatif sur Gemma-4 26B n'est bénéfique que lorsque le taux d'acceptation des tokens candidats dépasse 50 % — d'après les benchmarks mlx-vlm sur M4 Max Studio.

OpenClawRadar