Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %

✍️ OpenClawRadar📅 Publié: February 28, 2026🔗 Source
Le serveur MCP en mode contexte réduit l'utilisation du contexte de code Claude de 98 %
Ad

Le mode Contexte est un serveur MCP qui s'intercale entre Claude Code et les sorties d'outils, réduisant la consommation de la fenêtre de contexte de 98 %. Au lieu de déverser des données brutes dans la fenêtre de contexte de 200K, il traite les sorties dans des sandboxs isolés.

Fonctionnement

Le système de sandbox lance des sous-processus isolés pour chaque appel d'exécution. Les scripts s'exécutent dans ces sous-processus avec leurs propres limites de processus, et seul stdout entre dans le contexte de la conversation. Les données brutes comme les fichiers journaux, les réponses API et les instantanés ne quittent jamais le sandbox.

Dix environnements d'exécution de langages sont disponibles : JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl et R. Bun est détecté automatiquement pour une exécution JS/TS 3 à 5 fois plus rapide. Les CLI authentifiées (gh, aws, gcloud, kubectl, docker) fonctionnent via le passage d'identifiants où les sous-processus héritent des variables d'environnement et des chemins de configuration sans les exposer à la conversation.

Fonctionnalités de la base de connaissances

L'outil d'indexation segmente le contenu markdown par titres tout en conservant les blocs de code intacts, puis les stocke dans une table virtuelle SQLite FTS5. La recherche utilise le classement BM25 avec le stemming Porter appliqué au moment de l'indexation. Lorsque vous appelez la recherche, elle renvoie des blocs de code exacts avec leur hiérarchie de titres.

L'outil fetch_and_index étend cela aux URL : récupérer, convertir HTML en markdown, segmenter et indexer. La page brute n'entre jamais dans le contexte.

Ad

Benchmarks de performance

  • Instantané Playwright : 56 Ko → 299 o
  • Problèmes GitHub (20) : 59 Ko → 1,1 Ko
  • Journal d'accès (500 requêtes) : 45 Ko → 155 o
  • CSV analytique (500 lignes) : 85 Ko → 222 o
  • Journal Git (153 commits) : 11,6 Ko → 107 o
  • Recherche de dépôt (sous-agent) : 986 Ko → 62 Ko (5 appels contre 37)

Sur une session complète : 315 Ko de sortie brute deviennent 5,4 Ko. Le temps de session avant ralentissement passe d'environ 30 minutes à environ 3 heures. Contexte restant après 45 minutes : 99 % au lieu de 60 %.

Installation

Deux méthodes d'installation :

  • Place de marché des plugins : /plugin marketplace add mksglu/claude-context-mode puis /plugin install context-mode@claude-context-mode
  • MCP uniquement : claude mcp add context-mode -- npx -y context-mode

Après l'installation, redémarrez Claude Code. Le mode Contexte inclut un crochet PreToolUse qui achemine automatiquement les sorties d'outils via le sandbox. Les sous-agents apprennent à utiliser batch_execute comme outil principal, et les sous-agents bash sont améliorés pour devenir polyvalents afin qu'ils puissent accéder aux outils MCP.

L'outil est open source sous licence MIT sur github.com/mksglu/claude-context-mode.

📖 Lire la source complète : HN LLM Tools

Ad

👀 See Also

Beacon : Télémétrie de point de terminaison open source pour agents IA locaux
Tools

Beacon : Télémétrie de point de terminaison open source pour agents IA locaux

Beacon capture l'activité des agents IA locaux (Claude Code, Codex CLI, Cursor, etc.) et la normalise en événements de endpoint pour inspection ou transfert vers SIEM via Wazuh, Elastic, Splunk HEC.

OpenClawRadar
Claude 4.6 Opus raisonnement distillé à 14 Go pour Apple Silicon via la quantification MLX
Tools

Claude 4.6 Opus raisonnement distillé à 14 Go pour Apple Silicon via la quantification MLX

Un développeur a quantifié un modèle Qwen 3.5 27B distillé à partir des trajectoires de raisonnement de Claude 4.6 Opus, réduisant sa taille de 55,6 Go à 14 Go en utilisant MLX pour Apple Silicon, atteignant environ 16 tokens/seconde sur un M4 Pro tout en conservant les capacités de raisonnement analytique du modèle.

OpenClawRadar
GitVelocity : L'IA évalue 50 000 PR et révèle des informations sur la complexité du code
Tools

GitVelocity : L'IA évalue 50 000 PR et révèle des informations sur la complexité du code

GitVelocity utilise Claude pour évaluer les pull requests fusionnées sur une échelle de 0 à 100 selon six dimensions : portée, architecture, implémentation, risque, qualité et performance/sécurité. Après avoir analysé plus de 50 000 PR dans les langages TypeScript, Python, Rust, Go, Java et Elixir, l'équipe a découvert des tendances surprenantes concernant la taille des PR, la couverture des tests et l'adoption de l'IA.

OpenClawRadar
OpenTrace : Serveur d'observabilité auto-hébergé avec plus de 75 outils MCP
Tools

OpenTrace : Serveur d'observabilité auto-hébergé avec plus de 75 outils MCP

OpenTrace est un serveur d'observabilité auto-hébergé qui fournit des journaux, des analyses utilisateur et une introspection de base de données via plus de 75 outils MCP, fonctionnant sur un VPS à 4 $ avec stockage SQLite et connexions PostgreSQL en lecture seule.

OpenClawRadar