Réduction des jetons d'agent Slash de 80k à 31k : comment faire

Un développeur sur r/openclaw a partagé une méthode pratique pour réduire drastiquement la consommation de jetons de démarrage des agents de codage basés sur LLM. L'approche : exécuter un LLM sur tous les fichiers markdown à la racine de l'espace de travail pour identifier et éliminer le superflu et les doublons.

Actions clés

Examiner chaque fichier markdown à la racine de l'espace de travail pour rechercher le contenu redondant ou trop verbeux (par exemple, journaux de modifications, mémoires dupliquées, informations utilisateur).
Structurer les fichiers restants de manière similaire à un système de mémoire pour assurer la cohérence.
Utiliser un outil en ligne de commande (codex) au lieu de passer par l'agent pour garder le processus objectif.
Créer un fichier TOOLS avec des notes rapides et un dossier tools/ séparé contenant les détails par outil que l'agent peut consulter à la demande.
Ajouter de nouveaux fichiers comme voice pour maintenir un ton cohérent entre différents modèles.

Résultats

Les jetons de démarrage sont passés de 80k à 31k — une réduction de 61 %. L'espace de travail est devenu plus léger et l'agent plus réactif sans perdre de contexte essentiel.

Pourquoi c'est important

Un nombre élevé de jetons de démarrage se traduit par des temps de réponse plus lents et des coûts plus élevés. Auditer régulièrement les fichiers de l'espace de travail avec un LLM — en dehors de la boucle de l'agent — empêche l'accumulation de superflu et maintient le budget de jetons sous contrôle.

À qui cela s'adresse

Aux développeurs qui exécutent des agents de codage IA à longue durée de vie et qui souhaitent réduire le gaspillage de jetons et améliorer les performances de l'agent sans sacrifier la qualité du contexte.

📖 Lire la source complète : r/openclaw

Réduction de 60 % des jetons de démarrage de l'agent Slash : Nettoyez l'espace de travail de votre bot

Actions clés

Résultats

Pourquoi c'est important

À qui cela s'adresse

👀 See Also

Comment désactiver la fonction de verb spinner de Claude Code

Économisez sur les factures de Claude Code en acheminant les jetons de planification vers des modèles moins chers

Des invites système courtes améliorent l'adhérence de Claude et réduisent le gaspillage de jetons

Prévenir la dérive des réponses dans les longs fils Claude en ancrant des réponses de haute qualité