Réduction de 60 % des jetons de démarrage de l'agent Slash : Nettoyez l'espace de travail de votre bot
Un développeur sur r/openclaw a partagé une méthode pratique pour réduire drastiquement la consommation de jetons de démarrage des agents de codage basés sur LLM. L'approche : exécuter un LLM sur tous les fichiers markdown à la racine de l'espace de travail pour identifier et éliminer le superflu et les doublons.
Actions clés
- Examiner chaque fichier markdown à la racine de l'espace de travail pour rechercher le contenu redondant ou trop verbeux (par exemple, journaux de modifications, mémoires dupliquées, informations utilisateur).
- Structurer les fichiers restants de manière similaire à un système de mémoire pour assurer la cohérence.
- Utiliser un outil en ligne de commande (
codex) au lieu de passer par l'agent pour garder le processus objectif. - Créer un fichier
TOOLSavec des notes rapides et un dossiertools/séparé contenant les détails par outil que l'agent peut consulter à la demande. - Ajouter de nouveaux fichiers comme
voicepour maintenir un ton cohérent entre différents modèles.
Résultats
Les jetons de démarrage sont passés de 80k à 31k — une réduction de 61 %. L'espace de travail est devenu plus léger et l'agent plus réactif sans perdre de contexte essentiel.
Pourquoi c'est important
Un nombre élevé de jetons de démarrage se traduit par des temps de réponse plus lents et des coûts plus élevés. Auditer régulièrement les fichiers de l'espace de travail avec un LLM — en dehors de la boucle de l'agent — empêche l'accumulation de superflu et maintient le budget de jetons sous contrôle.
À qui cela s'adresse
Aux développeurs qui exécutent des agents de codage IA à longue durée de vie et qui souhaitent réduire le gaspillage de jetons et améliorer les performances de l'agent sans sacrifier la qualité du contexte.
📖 Lire la source complète : r/openclaw
👀 See Also

Comment désactiver la fonction de verb spinner de Claude Code
Claude Code inclut un tourniquet de verbes par défaut qui affiche des gérondifs fantaisistes comme 'Assaisonner' et 'Fabriquer' pendant le traitement. Vous pouvez le désactiver en modifiant le fichier settings.json avec un espace vide dans le tableau spinnerVerbs.

Économisez sur les factures de Claude Code en acheminant les jetons de planification vers des modèles moins chers
Un utilisateur a économisé 40 $ de frais de dépassement en répartissant les workflows Claude Code : les étapes de planification vont sur Haiku 3.5, les modifications et décisions réelles restent sur Opus/Sonnet. Un wrapper de 30 lignes gère le routage ; la configuration a pris environ 2 heures.

Des invites système courtes améliorent l'adhérence de Claude et réduisent le gaspillage de jetons
Un développeur a découvert qu'en remplaçant une instruction système de 3 847 mots par plusieurs petites instructions ciblées (total ~200 mots), les dérives d'oubli des instructions de Claude ont disparu.

Prévenir la dérive des réponses dans les longs fils Claude en ancrant des réponses de haute qualité
Un utilisateur décrit comment les réponses de Claude se dégradent après 30 à 40 messages, et comment ils ancrent le meilleur résultat en milieu de fil pour démarrer de nouvelles conversations.