moine : Une compétence qui réduit au silence la narration de l'agent pour économiser le contexte et les jetons

Un utilisateur de Reddit a créé monk, une compétence qui fait fonctionner les agents IA en silence — supprimant les narrations, préambules, postambules et commentaires de progression des réponses, ne conservant que les résultats. L'effet est une réduction estimée à 54% des tokens de sortie par tour (47% en codage, 65% en chat, 54% en recherche) et des économies de contexte cumulatives qui augmentent avec la durée de la session.
Comment ça marche
monk supprime toute narration du type "Je suis en train de faire X...", les widgets de liste de tâches et les pings de statut. L'agent produit uniquement les résultats standard à la fin de chaque étape. La compétence est disponible sur GitHub : github.com/marpxxx/skillz/tree/main/monk.
Résultats des benchmarks
Les tests ont utilisé 30 tâches (10 par catégorie : codage, chat, recherche) avec une verbosité approximée via le tokenizer cl100k_base d'OpenAI. Chiffres clés :
- Économies de sortie par tour : Codage 47%, Chat 65%, Recherche 54%, Global 54%.
- Gain de capacité de contexte (cumulatif) : À ~20 tours (session typique), +13% (codage), +14% (chat), +20% (recherche). À 100 tours, +29% (codage), +36% (chat), +39% (recherche).
- Coût API (Claude Sonnet 4.6, mise en cache des prompts) : ~19% d'économie de coût sur une session de 10 tours.
Le test n'a pas compté les tokens supprimés dans les widgets d'utilisation d'outils ou les pings de statut, donc les économies réelles pourraient être plus élevées.
Limitations
Les échantillons verbaux sont des approximations générées par IA. Un agent de base bien réglé peut déjà être plus concis ; un agent verbeux avec des compétences riches en narration peut en produire davantage. Le tokenizer est celui d'OpenAI (cl100k_base), pas celui d'Anthropic. L'hypothèse d'un prompt système de 8k est prudente (de nombreuses configurations ont 15-30k). Les résultats sont des estimations directionnelles, pas des benchmarks de production.
Pour les développeurs qui lisent rarement les sorties en temps réel de l'agent, cette compétence peut réduire le bruit et étendre considérablement la fenêtre de contexte.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

ClawProxy : Proxy de Routage IA Auto-hébergé pour la Rotation de Clés API en Version Gratuite
ClawProxy est un proxy de routage IA auto-hébergé qui gère plusieurs clés API gratuites pour éviter les limites de débit et les surcharges des fournisseurs. Il propose une rotation de clés en vol, un équilibrage de charge pondéré, une traduction de modèles et un tableau de bord avec des journaux analysés en profondeur.

Murmur : Un démon Cron open-source pour automatiser les sessions de code Claude
Murmur est un démon cron qui planifie et automatise les sessions de code Claude en utilisant un fichier HEARTBEAT.md pour la configuration.

Jentic Mini : Couche d'exécution d'API et d'actions auto-hébergée pour OpenClaw
Jentic Mini est une couche d'exécution d'API et d'actions auto-hébergée qui se situe entre les agents d'IA et les API externes, stockant les identifiants dans un coffre-fort chiffré et fournissant des boîtes à outils délimitées avec des clés individuellement révocables. Elle importe automatiquement plus de 10 000 spécifications OpenAPI et sources de flux de travail Arazzo lorsque des identifiants sont ajoutés.

La nouvelle API de données structurées propose des tarifs d'abonnement pour les agents LLM.
Un développeur a publié une API de données structurées qui normalise les tarifs d'abonnement sur les plateformes de streaming, les services de covoiturage, les applications de rencontre et d'autres plateformes basées sur l'abonnement. L'API fournit des schémas JSON cohérents, des tarifs adaptés à la région lorsque disponibles, et des points de terminaison compatibles MCP pour que les agents LLM puissent les consommer sans avoir à extraire des données.