Monk: Réduisez les tokens de 54% avec cette compétence Claude

Un utilisateur de Reddit a créé monk, une compétence qui fait fonctionner les agents IA en silence — supprimant les narrations, préambules, postambules et commentaires de progression des réponses, ne conservant que les résultats. L'effet est une réduction estimée à 54% des tokens de sortie par tour (47% en codage, 65% en chat, 54% en recherche) et des économies de contexte cumulatives qui augmentent avec la durée de la session.

Comment ça marche

monk supprime toute narration du type "Je suis en train de faire X...", les widgets de liste de tâches et les pings de statut. L'agent produit uniquement les résultats standard à la fin de chaque étape. La compétence est disponible sur GitHub : github.com/marpxxx/skillz/tree/main/monk.

Résultats des benchmarks

Les tests ont utilisé 30 tâches (10 par catégorie : codage, chat, recherche) avec une verbosité approximée via le tokenizer cl100k_base d'OpenAI. Chiffres clés :

Économies de sortie par tour : Codage 47%, Chat 65%, Recherche 54%, Global 54%.
Gain de capacité de contexte (cumulatif) : À ~20 tours (session typique), +13% (codage), +14% (chat), +20% (recherche). À 100 tours, +29% (codage), +36% (chat), +39% (recherche).
Coût API (Claude Sonnet 4.6, mise en cache des prompts) : ~19% d'économie de coût sur une session de 10 tours.

Le test n'a pas compté les tokens supprimés dans les widgets d'utilisation d'outils ou les pings de statut, donc les économies réelles pourraient être plus élevées.

Limitations

Les échantillons verbaux sont des approximations générées par IA. Un agent de base bien réglé peut déjà être plus concis ; un agent verbeux avec des compétences riches en narration peut en produire davantage. Le tokenizer est celui d'OpenAI (cl100k_base), pas celui d'Anthropic. L'hypothèse d'un prompt système de 8k est prudente (de nombreuses configurations ont 15-30k). Les résultats sont des estimations directionnelles, pas des benchmarks de production.

Pour les développeurs qui lisent rarement les sorties en temps réel de l'agent, cette compétence peut réduire le bruit et étendre considérablement la fenêtre de contexte.

📖 Lire la source complète : r/ClaudeAI

moine : Une compétence qui réduit au silence la narration de l'agent pour économiser le contexte et les jetons

Comment ça marche

Résultats des benchmarks

Limitations

👀 See Also

Sylve : Un plan de gestion FreeBSD pour la virtualisation, les conteneurs et le stockage

Deux compétences gratuites de Claude Code : Générateur de tutoriels et Correcteur de prompts

Pipeline de Contenu Multi-Agent pour le Code Claude avec Portes de Qualité

Exécution de Qwen3.6-35B-A3B-UD-Q5_K_XL en local avec VS Code Copilot sur AMD R9700