Apideck CLI : alternative MCP à faible contexte pour agents IA

Le Problème de Fenêtre Contextuelle de MCP

L'article décrit un scénario spécifique : connecter GitHub, Slack et Sentry via des serveurs MCP (environ 40 outils au total) consomme plus de 55 000 tokens avant même que l'agent ne traite un seul message utilisateur. Cela représente plus d'un quart de la limite de 200k de Claude. Chaque définition d'outil MCP coûte 550 à 1 400 tokens pour son nom, sa description, son schéma JSON, les descriptions de champs, les énumérations et les instructions système.

Une équipe a rapporté que trois serveurs MCP consommaient 143 000 des 200 000 tokens (72 % de la fenêtre contextuelle), ne laissant que 57 000 tokens pour la conversation réelle, les documents récupérés, le raisonnement et la réponse.

David Zhang (@dzhng), en développant Duet, a décrit avoir supprimé complètement les intégrations MCP en raison d'un "trilemme" : tout charger au départ et perdre la mémoire de travail, limiter les intégrations pour que l'agent ne puisse communiquer qu'avec quelques services, ou construire un chargement dynamique d'outils qui ajoute de la latence et de la complexité middleware.

Résultats des Benchmarks

Un benchmark réalisé par Scalekit a effectué 75 comparaisons directes (même modèle : Claude Sonnet 4, mêmes tâches, mêmes prompts) et a constaté :

MCP coûte 4 à 32 fois plus de tokens que CLI pour des opérations identiques
Vérifier la langue d'un dépôt a consommé 1 365 tokens via CLI contre 44 026 via MCP
La surcharge est presque entièrement due aux schémas : 43 définitions d'outils injectées dans chaque conversation, dont l'agent n'en utilise qu'une ou deux

L'Approche Apideck CLI

L'Apideck CLI utilise un prompt d'agent d'environ 80 tokens qui remplace des dizaines de milliers de tokens de schéma. Il propose une divulgation progressive via --help et une sécurité structurelle intégrée au binaire. Tout agent capable d'exécuter des commandes shell peut l'utiliser sans nécessiter de support protocolaire.

Réponses de l'Industrie à l'Encombrement Contextuel

L'article identifie trois approches de l'industrie :

MCP avec astuces de compression : Compresser les schémas, utiliser la recherche d'outils pour charger les définitions à la demande, ou construire un middleware qui découpe les spécifications OpenAPI en morceaux plus petits. Cela fonctionne pour des interactions petites et bien définies mais ajoute des besoins en infrastructure (registre d'outils, logique de recherche, mise en cache, routage).
Interfaces CLI-first : L'approche adoptée par Apideck CLI.
Protocoles natifs aux agents : Mentionnés mais non détaillés dans le texte source fourni.

📖 Read the full source: HN AI Agents

Apideck CLI : Une alternative à faible contexte au MCP pour les agents IA

Le Problème de Fenêtre Contextuelle de MCP

Résultats des Benchmarks

L'Approche Apideck CLI

Réponses de l'Industrie à l'Encombrement Contextuel

👀 See Also

Extension VS Code de Claude - Le curseur d'effort de raisonnement envoie des valeurs incohérentes

Application de bureau cc+ pour Claude Code : Gestion multi-sessions et orchestration de flotte

Support officiel de Kotlin pour VS Code désormais en alpha — Propulsé par le serveur de langage d'IntelliJ

Revdiff : Visualiseur de Différences en Terminal avec Annotations Inline pour Agents IA