PTC Thalamus : 40-65% d'économie de tokens sur l'analyse

Un développeur a créé une implémentation locale d'Appel d'Outils Programmatique (PTC) pour Claude Code et a analysé 79 sessions d'utilisation réelles pour mesurer les bénéfices concrets. Le PTC diffère de l'appel d'outils normal en ce que l'agent écrit du code qui s'exécute dans un environnement isolé, avec seulement les résultats finaux entrant dans la fenêtre de contexte au lieu de chaque étape intermédiaire.

Ce qui a été construit

Le développeur a créé Thalamus, un serveur MCP local qui fournit une capacité de type PTC à Claude Code. Il inclut quatre outils : execute() (exécute Python avec des primitives), search, remember et context. L'implémentation compte 143 tests, utilise uniquement la bibliothèque standard de Python et s'exécute entièrement en local. Le développeur souligne qu'il s'agit de sa propre implémentation, et non du PTC officiel d'Anthropic.

Résultats mesurés sur 79 sessions

Empreinte de tokens par appel : execute() a fait en moyenne ~2 600 caractères contre ~4 400 caractères en moyenne pour Read
Réduction de la taille JSONL : Les sessions utilisant le PTC ont montré une réduction de taille de -15,6 %
Économies sur les tâches d'analyse/recherche : 40-65 %
Économies sur les tâches d'écriture de code : ~0 %

Le développeur note que ces chiffres du monde réel sont "loin des 98 %" d'économies rapportés dans des scénarios optimaux par Anthropic et Cloudflare.

Comment l'agent utilise réellement execute()

L'analyse du contenu de 112 appels execute() a révélé :

64 % utilisaient du Python standard (os.walk, open, sqlite3, subprocess) — pas les primitives PTC
30 % utilisaient une seule primitive (un fs.read ou fs.grep)
5 % effectuaient un véritable regroupement (2+ primitives combinées)

Le modèle "remplacer 5 Reads par 1 execute" n'est survenu que dans 5 % de l'utilisation réelle. L'agent a principalement utilisé execute() comme un environnement de calcul polyvalent pour accéder à des fichiers en dehors du projet, exécuter des agrégations et interroger des bases de données.

Modèles d'adoption

La mesure initiale a montré que seulement 25 % des sessions utilisaient le PTC, l'agent privilégiant par défaut Read/Grep/Glob. Après avoir ajouté un manuel opérationnel d'environ 1 100 tokens à CLAUDE.md, l'adoption est passée à 42,9 %. Les sessions axées sur l'écriture de code (dominées par Edit + Bash) n'ont montré aucune utilisation du PTC.

Le développeur conclut que le PTC brille dans les tâches d'analyse, de débogage et de recherche multi-fichiers, mais pas dans les flux de travail de développement à forte composante d'édition.

📖 Read the full source: r/ClaudeAI

PTC construit par l'utilisateur pour Claude Code montre 40 à 65 % d'économie de tokens sur les tâches d'analyse, pas sur l'écriture de code.

Ce qui a été construit

Résultats mesurés sur 79 sessions

Comment l'agent utilise réellement execute()

Modèles d'adoption

👀 See Also

Visdiff : Boucle de rétroaction visuelle pour la génération de code frontend de Claude

Traduction vers fr : Compétence Aventure Textuelle Claude v1.1.0 Ajoute des Arcs de Campagne et des PNJ Améliorés

Gestionnaire de projet de style Trello local pour agents OpenClaw utilisant des fichiers markdown

Compétence de codage Karpathy réécrite pour le plan gratuit, débloque la discipline de codage Claude sans Pro