Mode Contexte : Compresser 315 Ko en 5,4 Ko pour Claude Code

Ce que fait le mode Contexte

Le mode Contexte résout le problème où chaque appel d'outil MCP dans Claude Code déverse des données brutes dans la fenêtre de contexte de 200K. Des exemples de la source montrent qu'une capture Playwright coûte 56 Ko, vingt problèmes GitHub coûtent 59 Ko, et un journal d'accès coûte 45 Ko. Après 30 minutes, 40 % de votre contexte peuvent avoir disparu.

Le serveur MCP s'intercale entre Claude Code et ces sorties, les traitant dans des sandbox afin que seuls des résumés atteignent le modèle. Il réalise une réduction de 98 % de l'utilisation du contexte (315 Ko devient 5,4 Ko).

Installation et configuration

Installation en une seule commande :

/plugin marketplace add mksglu/claude-context-mode
/plugin install context-mode@claude-context-mode

Ou via CLI :

claude mcp add context-mode -- npx -y context-mode

L'installation inclut une compétence de routage automatique qui achemine automatiquement les grandes sorties via le mode Contexte, plus un crochet PreToolUse qui injecte le routage context-mode dans les invites des sous-agents. Aucune invite n'est nécessaire.

Outils disponibles

batch_execute : Exécuter plusieurs commandes + rechercher plusieurs requêtes en UN appel (986 Ko → 62 Ko)
execute : Exécuter du code dans 10 langages. Seul stdout entre dans le contexte (56 Ko → 299 o)
execute_file : Traiter des fichiers dans un sandbox. Le contenu brut ne quitte jamais (45 Ko → 155 o)
index : Découper du markdown en FTS5 avec classement BM25 (60 Ko → 40 o)
search : Interroger le contenu indexé avec plusieurs requêtes en un appel (récupération à la demande)
fetch_and_index : Récupérer une URL, convertir en markdown, indexer (60 Ko → 40 o)
stats : Suivi des jetons de session avec ventilation par outil

Implémentation technique

Chaque appel execute lance un sous-processus isolé avec sa propre limite de processus. Les scripts ne peuvent pas accéder à la mémoire ou à l'état des autres. Le sous-processus exécute votre code, capture stdout, et seul ce stdout entre dans le contexte de conversation. Les données brutes — fichiers journaux, réponses API, captures — ne quittent jamais le sandbox.

Dix environnements d'exécution de langage sont disponibles : JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl, R. Bun est auto-détecté pour une exécution JS/TS 3 à 5 fois plus rapide.

Les CLI authentifiés fonctionnent via le passage d'identifiants — gh, aws, gcloud, kubectl, docker héritent des variables d'environnement et des chemins de configuration sans les exposer à la conversation.

Lorsque la sortie dépasse 5 Ko et qu'une intention est fournie, le mode Contexte passe à un filtrage basé sur l'intention : il indexe la sortie complète dans la base de connaissances, recherche les sections correspondant à votre intention, et ne renvoie que les correspondances pertinentes avec un vocabulaire de termes interrogeables pour les requêtes de suivi.

La base de connaissances utilise des tables virtuelles SQLite FTS5 (Full-Text Search 5). L'outil index découpe le contenu markdown par titres tout en conservant les blocs de code intacts, puis les stocke. La recherche utilise le classement BM25 — un algorithme de pertinence probabiliste qui évalue les documents en fonction de la fréquence des termes, de la fréquence inverse du document et de la longueur du document.

📖 Lire la source complète : HN AI Agents

Mode Contexte : Un serveur MCP qui compresse les sorties d'outils pour Claude Code

Ce que fait le mode Contexte

Installation et configuration

Outils disponibles

Implémentation technique

👀 See Also

Interrogez votre sprint Jira via Claude MCP : statut instantané, problèmes non attribués et éléments bloqués

Intégration de la Mémoire Locale de Claude Code avec Shodh : Amélioration de la Rétention du Contexte dans le Temps

Création d'une application macOS de transcription vocale locale avec Claude Code : Étude de cas Vext

Compétence de Traduction Vidéo OpenClaw Disponible sur ClawHub