Le pipeline MCP à appel unique réduit l'utilisation des tokens de Claude Code de 74 %.

✍️ OpenClawRadar📅 Publié: March 1, 2026🔗 Source
Le pipeline MCP à appel unique réduit l'utilisation des tokens de Claude Code de 74 %.
Ad

Un développeur a partagé son expérience de création d'un moteur contextuel (serveur MCP) qui donne à Claude Code un graphe de dépendances des bases de code, lui permettant de lire uniquement le code pertinent au lieu des fichiers entiers. L'outil réduit considérablement l'utilisation de tokens en servant des graphes de dépendances et des squelettes plutôt que des fichiers bruts.

Problème initial et solution initiale

Claude Code lit généralement des fichiers entiers et déverse tout dans le contexte, consommant rapidement des tokens. L'approche initiale consistait à servir uniquement le code pertinent via MCP en utilisant des graphes de dépendances et des squelettes au lieu de fichiers bruts, ce qui a réduit à lui seul l'utilisation de tokens de 65 %.

Inefficacité identifiée et solution

Les utilisateurs ont souligné que le flux de travail MCP lui-même était inefficace, avec des agents effectuant plusieurs allers-retours : appel de get_context_capsule, lecture du résultat, puis appel de get_impact_graph, lecture de ce résultat, suivi de search_memory, et lecture de ce résultat. Cela créait trois allers-retours avec des résultats chevauchants dans le contexte.

La correction run_pipeline

Le développeur a livré un outil MCP en un seul appel appelé run_pipeline qui remplace le flux de travail en plusieurs étapes. L'outil détecte automatiquement l'intention (déboguer/modifier/refactoriser/explorer) et exécute la combinaison appropriée de recherche contextuelle, d'analyse d'impact et de rappel de mémoire côté serveur.

run_pipeline({
  task: "corriger le bug de validation JWT",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT utilise Ed25519" // enregistrer l'information dans le même appel
})

Cet appel unique remplace 3-4 appels individuels. Les résultats sont dédupliqués et fusionnés dans un budget de tokens avant d'atteindre la fenêtre de contexte, ce qui entraîne environ 60 % de tokens de contexte en moins par rapport à l'appel d'outils individuellement. Le paramètre observation permet aux agents d'enregistrer des informations apprises dans le même appel sans étape save_observation séparée. La mémoire est liée aux nœuds du graphe de code, donc lorsque le code change, les observations sont automatiquement marquées comme obsolètes.

Ad

Fonctionnalités supplémentaires livrées

  • Pipeline d'observation passive : observateur de fichiers → différence de hachage blake3 → différences structurelles au niveau AST → auto-correlation avec les appels d'outils → observations sans configuration
  • CLI fonctionnant sans VS Code : npm install -g vexp-cli
  • Crochets Git qui n'écrasent pas les crochets existants (blocs délimités par des marqueurs)
  • Affichage des économies de tokens dans la barre latérale de VS Code montrant les chiffres réels avec une fenêtre glissante de 24 heures

Disponibilité

L'outil est gratuit à essayer avec un niveau gratuit généreux offrant 2 000 nœuds, des fonctionnalités de pipeline de base et une mémoire de session complète. Aucun compte ni clé API n'est requis, et il n'effectue aucun appel réseau. L'architecture principale comprend un moteur de graphe Rust et des analyseurs tree-sitter construits par le développeur, avec Claude Code assistant sur la couche de protocole MCP, les migrations de schéma SQLite et les modèles d'instructions des agents.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

devopsiphai : Audits de santé opérationnelle des compétences en code Claude open-source à travers 6 phases
Tools

devopsiphai : Audits de santé opérationnelle des compétences en code Claude open-source à travers 6 phases

devopsiphai est une compétence Claude Code open-source qui audite l'opérabilité des projets de production en utilisant un processus en 6 phases et le cadre ARC, produisant des notes alphabétiques et un TODO.md structuré avec des tâches estimées en effort.

OpenClawRadar
Spore Agent Arena : Plateforme de Test d'Agents IA Compétitifs Recherche des Participants pour un Essai
Tools

Spore Agent Arena : Plateforme de Test d'Agents IA Compétitifs Recherche des Participants pour un Essai

La fonctionnalité Arena de Spore Agent permet aux agents IA de s'affronter dans 36 types de jeux différents, incluant le débogage de code, des énigmes mathématiques et des défis de conception système. La plateforme compte actuellement 42 défis en cours, 15 agents inscrits et propose des jetons Cog comme récompenses.

OpenClawRadar
Serveur MCP pour les fichiers XMind locaux publié
Tools

Serveur MCP pour les fichiers XMind locaux publié

Un développeur a publié un serveur MCP qui fournit 22 outils pour lire et écrire des fichiers de cartes mentales XMind locaux. Le serveur fonctionne avec des clients IA compatibles MCP comme Claude Desktop et Cursor.

OpenClawRadar
Phalanx CLI coordonne plusieurs agents IA pour des cycles de revue de code automatisés.
Tools

Phalanx CLI coordonne plusieurs agents IA pour des cycles de revue de code automatisés.

Un développeur a créé Phalanx, un outil CLI qui coordonne des agents IA de différents fournisseurs : Codex gère le codage, Claude Opus effectue la revue de code, et Claude Sonnet orchestre la boucle. Un outil compagnon appelé Codebones compresse les dépôts en cartes structurelles pour réduire l'utilisation de tokens.

OpenClawRadar