PTC construit par l'utilisateur pour Claude Code montre 40 à 65 % d'économie de tokens sur les tâches d'analyse, pas sur l'écriture de code.

✍️ OpenClawRadar📅 Publié: March 29, 2026🔗 Source
PTC construit par l'utilisateur pour Claude Code montre 40 à 65 % d'économie de tokens sur les tâches d'analyse, pas sur l'écriture de code.
Ad

Un développeur a créé une implémentation locale d'Appel d'Outils Programmatique (PTC) pour Claude Code et a analysé 79 sessions d'utilisation réelles pour mesurer les bénéfices concrets. Le PTC diffère de l'appel d'outils normal en ce que l'agent écrit du code qui s'exécute dans un environnement isolé, avec seulement les résultats finaux entrant dans la fenêtre de contexte au lieu de chaque étape intermédiaire.

Ce qui a été construit

Le développeur a créé Thalamus, un serveur MCP local qui fournit une capacité de type PTC à Claude Code. Il inclut quatre outils : execute() (exécute Python avec des primitives), search, remember et context. L'implémentation compte 143 tests, utilise uniquement la bibliothèque standard de Python et s'exécute entièrement en local. Le développeur souligne qu'il s'agit de sa propre implémentation, et non du PTC officiel d'Anthropic.

Résultats mesurés sur 79 sessions

  • Empreinte de tokens par appel : execute() a fait en moyenne ~2 600 caractères contre ~4 400 caractères en moyenne pour Read
  • Réduction de la taille JSONL : Les sessions utilisant le PTC ont montré une réduction de taille de -15,6 %
  • Économies sur les tâches d'analyse/recherche : 40-65 %
  • Économies sur les tâches d'écriture de code : ~0 %

Le développeur note que ces chiffres du monde réel sont "loin des 98 %" d'économies rapportés dans des scénarios optimaux par Anthropic et Cloudflare.

Ad

Comment l'agent utilise réellement execute()

L'analyse du contenu de 112 appels execute() a révélé :

  • 64 % utilisaient du Python standard (os.walk, open, sqlite3, subprocess) — pas les primitives PTC
  • 30 % utilisaient une seule primitive (un fs.read ou fs.grep)
  • 5 % effectuaient un véritable regroupement (2+ primitives combinées)

Le modèle "remplacer 5 Reads par 1 execute" n'est survenu que dans 5 % de l'utilisation réelle. L'agent a principalement utilisé execute() comme un environnement de calcul polyvalent pour accéder à des fichiers en dehors du projet, exécuter des agrégations et interroger des bases de données.

Modèles d'adoption

La mesure initiale a montré que seulement 25 % des sessions utilisaient le PTC, l'agent privilégiant par défaut Read/Grep/Glob. Après avoir ajouté un manuel opérationnel d'environ 1 100 tokens à CLAUDE.md, l'adoption est passée à 42,9 %. Les sessions axées sur l'écriture de code (dominées par Edit + Bash) n'ont montré aucune utilisation du PTC.

Le développeur conclut que le PTC brille dans les tâches d'analyse, de débogage et de recherche multi-fichiers, mais pas dans les flux de travail de développement à forte composante d'édition.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Codebook Lossless LLM Compression : Réduction de 10 à 25 % de la RAM grâce au Bitwise Packing
Tools

Codebook Lossless LLM Compression : Réduction de 10 à 25 % de la RAM grâce au Bitwise Packing

Le code de preuve de concept d'un développeur démontre une compression LLM sans perte en regroupant les poids fp16 en blocs, obtenant une réduction de 10 à 25 % de la RAM au prix d'une vitesse d'inférence approximativement divisée par deux. L'approche identifie que la plupart des modèles n'utilisent que 12 à 13 bits de valeurs uniques malgré la représentation sur 16 bits du fp16.

OpenClawRadar
Libretto : Génération Déterministe d'Automatisation de Navigateur pour les Agents d'IA de Programmation
Tools

Libretto : Génération Déterministe d'Automatisation de Navigateur pour les Agents d'IA de Programmation

Libretto est une boîte à outils Skill+CLI qui permet aux agents d'IA de codage de générer des scripts d'automatisation de navigateur déterministes sous forme de code réel, s'éloignant des agents d'IA en temps d'exécution. Il combine l'automatisation d'interface utilisateur Playwright avec des requêtes réseau/API directes pour la fiabilité et inclut des modes de débogage pas à pas et en lecture seule.

OpenClawRadar
Construction d'un agent de codage pour un contexte de 8k : répartition planificateur/exécuteur, budgétisation des jetons et exécution parallèle
Tools

Construction d'un agent de codage pour un contexte de 8k : répartition planificateur/exécuteur, budgétisation des jetons et exécution parallèle

Un aperçu détaillé de la construction d'un agent de codage CLI conçu pour des limites de 8 000 tokens, utilisant une architecture planificateur/exécuteur, un budget strict de tokens et une exécution parallèle des tâches.

OpenClawRadar
Ghostbar : un client IA Swift natif macOS d'environ 5 Mo qui se cache du partage d'écran
Tools

Ghostbar : un client IA Swift natif macOS d'environ 5 Mo qui se cache du partage d'écran

Ghostbar est un client IA natif Swift pour la barre de menus macOS (~5 Mo) qui utilise window.sharingType = .none pour devenir invisible aux enregistreurs d'écran. Fonctionne avec Ollama, vLLM, llama.cpp et tout backend compatible OpenAI.

OpenClawRadar