Mode Contexte : Un serveur MCP qui compresse les sorties d'outils pour Claude Code

Ce que fait le mode Contexte
Le mode Contexte résout le problème où chaque appel d'outil MCP dans Claude Code déverse des données brutes dans la fenêtre de contexte de 200K. Des exemples de la source montrent qu'une capture Playwright coûte 56 Ko, vingt problèmes GitHub coûtent 59 Ko, et un journal d'accès coûte 45 Ko. Après 30 minutes, 40 % de votre contexte peuvent avoir disparu.
Le serveur MCP s'intercale entre Claude Code et ces sorties, les traitant dans des sandbox afin que seuls des résumés atteignent le modèle. Il réalise une réduction de 98 % de l'utilisation du contexte (315 Ko devient 5,4 Ko).
Installation et configuration
Installation en une seule commande :
/plugin marketplace add mksglu/claude-context-mode
/plugin install context-mode@claude-context-modeOu via CLI :
claude mcp add context-mode -- npx -y context-modeL'installation inclut une compétence de routage automatique qui achemine automatiquement les grandes sorties via le mode Contexte, plus un crochet PreToolUse qui injecte le routage context-mode dans les invites des sous-agents. Aucune invite n'est nécessaire.
Outils disponibles
batch_execute: Exécuter plusieurs commandes + rechercher plusieurs requêtes en UN appel (986 Ko → 62 Ko)execute: Exécuter du code dans 10 langages. Seul stdout entre dans le contexte (56 Ko → 299 o)execute_file: Traiter des fichiers dans un sandbox. Le contenu brut ne quitte jamais (45 Ko → 155 o)index: Découper du markdown en FTS5 avec classement BM25 (60 Ko → 40 o)search: Interroger le contenu indexé avec plusieurs requêtes en un appel (récupération à la demande)fetch_and_index: Récupérer une URL, convertir en markdown, indexer (60 Ko → 40 o)stats: Suivi des jetons de session avec ventilation par outil
Implémentation technique
Chaque appel execute lance un sous-processus isolé avec sa propre limite de processus. Les scripts ne peuvent pas accéder à la mémoire ou à l'état des autres. Le sous-processus exécute votre code, capture stdout, et seul ce stdout entre dans le contexte de conversation. Les données brutes — fichiers journaux, réponses API, captures — ne quittent jamais le sandbox.
Dix environnements d'exécution de langage sont disponibles : JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl, R. Bun est auto-détecté pour une exécution JS/TS 3 à 5 fois plus rapide.
Les CLI authentifiés fonctionnent via le passage d'identifiants — gh, aws, gcloud, kubectl, docker héritent des variables d'environnement et des chemins de configuration sans les exposer à la conversation.
Lorsque la sortie dépasse 5 Ko et qu'une intention est fournie, le mode Contexte passe à un filtrage basé sur l'intention : il indexe la sortie complète dans la base de connaissances, recherche les sections correspondant à votre intention, et ne renvoie que les correspondances pertinentes avec un vocabulaire de termes interrogeables pour les requêtes de suivi.
La base de connaissances utilise des tables virtuelles SQLite FTS5 (Full-Text Search 5). L'outil index découpe le contenu markdown par titres tout en conservant les blocs de code intacts, puis les stocke. La recherche utilise le classement BM25 — un algorithme de pertinence probabiliste qui évalue les documents en fonction de la fréquence des termes, de la fréquence inverse du document et de la longueur du document.
📖 Lire la source complète : HN AI Agents
👀 See Also

Interrogez votre sprint Jira via Claude MCP : statut instantané, problèmes non attribués et éléments bloqués
Un utilisateur de Reddit a connecté Jira à Claude via MCP, puis a posé des questions en langage naturel sur son sprint et a obtenu instantanément des tableaux clairs — sans avoir à naviguer dans les tableaux.

Intégration de la Mémoire Locale de Claude Code avec Shodh : Amélioration de la Rétention du Contexte dans le Temps
Découvrez l'intégration de Claude Code avec la mémoire Shodh pour la conservation du contexte de projet à long terme en utilisant un serveur de mémoire local.

Création d'une application macOS de transcription vocale locale avec Claude Code : Étude de cas Vext
Un développeur a passé 3 mois à construire Vext, une application macOS de dictée vocale utilisant Whisper sur Apple Neural Engine. Claude Code a aidé avec le FFI Rust/Swift, l'optimisation Core ML et l'architecture des raccourcis clavier. L'application fonctionne 100 % hors ligne et transcrit 60 secondes d'audio en ~400 ms.

Compétence de Traduction Vidéo OpenClaw Disponible sur ClawHub
Une nouvelle compétence de traduction vidéo pour les agents OpenClaw permet aux utilisateurs de télécharger une vidéo ou de fournir une URL pour obtenir un aperçu traduit instantanément. La compétence est hébergée sur ClawHub.