Utilisateur de Reddit mesure la surcharge des tokens MCP : 67 000 tokens consommés avant toute question

✍️ OpenClawRadar📅 Publié: March 23, 2026🔗 Source
Utilisateur de Reddit mesure la surcharge des tokens MCP : 67 000 tokens consommés avant toute question
Ad

Mesure de la surcharge de jetons MCP

Un développeur sur r/ClaudeAI a mesuré la surcharge de jetons de ses serveurs Model Context Protocol (MCP) et a constaté une consommation significative de contexte avant toute interaction utilisateur.

Principales conclusions de la mesure

Le développeur a rapporté :

  • 67 000 jetons consommés avant même de poser une seule question
  • Cela représente un tiers de sa fenêtre de contexte rien qu'en chargeant les définitions d'outils
  • Playwright MCP seul utilisait 21 définitions d'outils (~13 600 jetons) à chaque session, qu'il utilise un navigateur ou non
  • GitHub MCP utilisait ~18 000 jetons en veille

Approches alternatives avec une surcharge réduite

Le développeur a mis en œuvre des alternatives :

  • Remplacé Playwright MCP par une compétence qui se charge à la demande, obtenant la même capacité avec environ 1/7e du coût de contexte
  • Utilisé l'interface en ligne de commande GitHub (gh) au lieu de GitHub MCP, qui utilise ~200 jetons par commande au lieu de 18 000 jetons en veille
Ad

Comparaison entre les approches

Le développeur a noté que les compétences + outils CLI :

  • Font le même travail que les serveurs MCP
  • Ne consomment des jetons que lorsqu'ils sont réellement utilisés
  • Les outils CLI se combinent entre eux d'une manière que les serveurs MCP ne peuvent pas

La mesure met en lumière le compromis entre commodité et efficacité de contexte lors de l'utilisation de serveurs MCP par rapport aux outils à la demande.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Besoin d'un serveur MCP fournissant une découverte d'outils sémantique pour les agents IA.
Tools

Besoin d'un serveur MCP fournissant une découverte d'outils sémantique pour les agents IA.

Un serveur MCP appelé Need permet une recherche sémantique parmi plus de 10 000 outils provenant de brew, npm, pip et cargo. Lorsqu'un agent demande une tâche comme 'compresser ces PNG', il trouve pngquant, l'installe, l'exécute et rapporte le succès.

OpenClawRadar
Résultats pratiques de 11 constructions logicielles multi-agents sans échafaudage programmatique
Tools

Résultats pratiques de 11 constructions logicielles multi-agents sans échafaudage programmatique

L'analyse de 11 constructions multi-agents autonomes montre que l'application du périmètre fonctionne mécaniquement (20/20 succès) et non via des prompts (0/20), les coûts d'orchestration sont dominés par la ré-ingestion de mémoire (~95% des dépenses d'entrée), et la capacité du modèle de travailleur crée des écarts de débit de 9,8x.

OpenClawRadar
Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %
Tools

Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %

Le mode Contexte est un serveur MCP qui réduit la consommation de contexte de Claude Code de 315 Ko à 5,4 Ko en isolant les sorties d'outils dans des sandboxs. Il prend en charge 10 environnements d'exécution de langages et inclut une base de connaissances avec recherche en texte intégral.

OpenClawRadar
Kontext CLI : Courtier d'identification pour agents d'IA de codage
Tools

Kontext CLI : Courtier d'identification pour agents d'IA de codage

Kontext CLI est un courtier d'identifiants basé sur Go qui fournit aux agents d'IA de codage des jetons d'accès à courte durée de vie au lieu de clés API à longue durée de vie. Il utilise l'échange de jetons RFC 8693, diffuse en continu les journaux d'audit pour chaque appel d'outil et fonctionne dès aujourd'hui avec Claude Code.

OpenClawRadar