Modo Contexto: Um Servidor MCP que Comprime Saídas de Ferramentas para Claude Code

O que o Context Mode Faz
O Context Mode aborda o problema em que cada chamada de ferramenta MCP no Claude Code despeja dados brutos na janela de contexto de 200K. Exemplos da fonte mostram que um snapshot do Playwright custa 56 KB, vinte issues do GitHub custam 59 KB, e um log de acesso custa 45 KB. Após 30 minutos, 40% do seu contexto pode ter sido consumido.
O servidor MCP fica entre o Claude Code e essas saídas, processando-as em sandboxes para que apenas resumos alcancem o modelo. Ele alcança uma redução de 98% no uso do contexto (315 KB se torna 5,4 KB).
Instalação e Configuração
Instalação com um único comando:
/plugin marketplace add mksglu/claude-context-mode
/plugin install context-mode@claude-context-modeOu via CLI:
claude mcp add context-mode -- npx -y context-modeA instalação inclui uma habilidade de roteamento automático que roteia automaticamente grandes saídas através do Context Mode, além de um hook PreToolUse que injeta roteamento de context-mode em prompts de subagentes. Nenhum prompt é necessário.
Ferramentas Disponíveis
batch_execute: Execute múltiplos comandos + pesquise múltiplas consultas em UMA chamada (986 KB → 62 KB)execute: Execute código em 10 linguagens. Apenas stdout entra no contexto (56 KB → 299 B)execute_file: Processe arquivos em sandbox. O conteúdo bruto nunca sai (45 KB → 155 B)index: Divida markdown em FTS5 com classificação BM25 (60 KB → 40 B)search: Consulte conteúdo indexado com múltiplas consultas em uma chamada (recuperação sob demanda)fetch_and_index: Busque URL, converta para markdown, indexe (60 KB → 40 B)stats: Rastreamento de tokens da sessão com detalhamento por ferramenta
Implementação Técnica
Cada chamada execute gera um subprocesso isolado com seu próprio limite de processo. Scripts não podem acessar a memória ou estado um do outro. O subprocesso executa seu código, captura stdout, e apenas esse stdout entra no contexto da conversação. Os dados brutos — arquivos de log, respostas de API, snapshots — nunca saem da sandbox.
Dez ambientes de execução de linguagem estão disponíveis: JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl, R. Bun é detectado automaticamente para execução 3-5x mais rápida de JS/TS.
CLIs autenticados funcionam através de passagem de credenciais — gh, aws, gcloud, kubectl, docker herdam variáveis de ambiente e caminhos de configuração sem expô-los à conversação.
Quando a saída excede 5 KB e uma intenção é fornecida, o Context Mode muda para filtragem baseada em intenção: ele indexa a saída completa na base de conhecimento, pesquisa por seções correspondentes à sua intenção, e retorna apenas as correspondências relevantes com um vocabulário de termos pesquisáveis para consultas de acompanhamento.
A base de conhecimento usa tabelas virtuais SQLite FTS5 (Full-Text Search 5). A ferramenta index divide o conteúdo markdown por cabeçalhos mantendo blocos de código intactos, então os armazena. A pesquisa usa classificação BM25 — um algoritmo de relevância probabilística que pontua documentos com base na frequência do termo, frequência inversa do documento e comprimento do documento.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Integração OpenClaw para Mercados de Ações Indianos: Terminal de Análise e Negociação Multi-Agente
Um terminal de negociação de código aberto para mercados indianos foi configurado como um servidor de habilidades OpenClaw, permitindo que qualquer agente OpenClaw obtenha dados do mercado de ações indiano e execute análises completas via HTTP sem instalação local. O sistema utiliza sete agentes especialistas trabalhando em paralelo para gerar análises estruturadas com planos de negociação.

O plugin MCP de cache de prompt reduz automaticamente os custos da API Claude ao identificar contextos estáveis
O plugin MCP de cache de prompts identifica automaticamente partes estáveis do contexto, como prompts do sistema e definições de ferramentas, e as marca para o recurso de cache da Anthropic, reduzindo os custos da API em 80-92% em sessões de programação.

Camada de Memória Auto-Hospedada para o Claude Roda Gratuitamente na Cloudflare
Um servidor MCP Cloudflare Worker permite que o Claude se lembre e recupere notas por meio de pesquisa semântica usando Workers AI e Vectorize — tudo no nível gratuito.

Servidor MCP Permite que o Claude Crie e Execute Ferramentas Personalizadas em Tempo de Execução
Um desenvolvedor criou um servidor MCP onde o Claude pode criar, atualizar e executar novas ferramentas sem necessidade de reimplantação. O sistema utiliza cinco ferramentas principais e executa código JavaScript/TypeScript personalizado em um sandbox Deno com inicialização a frio de ~50ms.