Apideck CLI : Une alternative à faible contexte au MCP pour les agents IA

Le Problème de Fenêtre Contextuelle de MCP
L'article décrit un scénario spécifique : connecter GitHub, Slack et Sentry via des serveurs MCP (environ 40 outils au total) consomme plus de 55 000 tokens avant même que l'agent ne traite un seul message utilisateur. Cela représente plus d'un quart de la limite de 200k de Claude. Chaque définition d'outil MCP coûte 550 à 1 400 tokens pour son nom, sa description, son schéma JSON, les descriptions de champs, les énumérations et les instructions système.
Une équipe a rapporté que trois serveurs MCP consommaient 143 000 des 200 000 tokens (72 % de la fenêtre contextuelle), ne laissant que 57 000 tokens pour la conversation réelle, les documents récupérés, le raisonnement et la réponse.
David Zhang (@dzhng), en développant Duet, a décrit avoir supprimé complètement les intégrations MCP en raison d'un "trilemme" : tout charger au départ et perdre la mémoire de travail, limiter les intégrations pour que l'agent ne puisse communiquer qu'avec quelques services, ou construire un chargement dynamique d'outils qui ajoute de la latence et de la complexité middleware.
Résultats des Benchmarks
Un benchmark réalisé par Scalekit a effectué 75 comparaisons directes (même modèle : Claude Sonnet 4, mêmes tâches, mêmes prompts) et a constaté :
- MCP coûte 4 à 32 fois plus de tokens que CLI pour des opérations identiques
- Vérifier la langue d'un dépôt a consommé 1 365 tokens via CLI contre 44 026 via MCP
- La surcharge est presque entièrement due aux schémas : 43 définitions d'outils injectées dans chaque conversation, dont l'agent n'en utilise qu'une ou deux
L'Approche Apideck CLI
L'Apideck CLI utilise un prompt d'agent d'environ 80 tokens qui remplace des dizaines de milliers de tokens de schéma. Il propose une divulgation progressive via --help et une sécurité structurelle intégrée au binaire. Tout agent capable d'exécuter des commandes shell peut l'utiliser sans nécessiter de support protocolaire.
Réponses de l'Industrie à l'Encombrement Contextuel
L'article identifie trois approches de l'industrie :
- MCP avec astuces de compression : Compresser les schémas, utiliser la recherche d'outils pour charger les définitions à la demande, ou construire un middleware qui découpe les spécifications OpenAPI en morceaux plus petits. Cela fonctionne pour des interactions petites et bien définies mais ajoute des besoins en infrastructure (registre d'outils, logique de recherche, mise en cache, routage).
- Interfaces CLI-first : L'approche adoptée par Apideck CLI.
- Protocoles natifs aux agents : Mentionnés mais non détaillés dans le texte source fourni.
📖 Read the full source: HN AI Agents
👀 See Also

Claude IDE Bridge : Outil WebSocket pour un accès IDE en temps réel
claude-ide-bridge est un pont WebSocket qui connecte directement Claude Code à l'état interne de l'IDE, permettant des diagnostics en direct, la navigation vers la définition, la recherche de références, l'affichage des types, l'ouverture de fichiers, la gestion des points d'arrêt et la diffusion de l'état du débogueur.

Améliorateur de prompt Claude Code v0.5.3 : Refonte du mode planification et recherche prioritaire par sous-agent
La v0.5.3 ajoute un hook PreToolUse pour la lisibilité du mode plan (réécritures propres, pas d'historique de décision) et déplace la recherche de requêtes vagues vers les sous-agents Task/Explore sur Haiku pour économiser les tokens du contexte principal. Le plugin fonctionne désormais sous Windows et compte plus de 1,4K étoiles sur GitHub.

Architor : Outil Open-Source pour les Workflows d'Architecture à Phases Contrôlées avec Claude Code
Architor est un outil open-source qui structure Claude Code en un assistant d'architecture à phases contrôlées avec une mémoire de conception persistante. Il organise la conception de systèmes en phases d'évaluation des exigences, de décisions d'architecture, de conception des composants et de validation, en suivant les décisions dans un espace de travail .arch.

Calmkeep : Une couche de continuité externe pour contrer la dérive des LLM dans les sessions prolongées
Calmkeep est une couche de continuité externe conçue pour contrer la dérive des LLM lors de sessions prolongées, affichant 85 % d'intégrité contre 60 % pour Claude standard dans un test de construction backend de 25 tours, et 100 % contre 50 % dans une session juridique.