Modo de Contexto do Servidor MCP Reduz Uso de Contexto de Código do Claude em 98%

Context Mode é um servidor MCP que fica entre o Claude Code e as saídas das ferramentas, reduzindo o consumo da janela de contexto em 98%. Em vez de despejar dados brutos na janela de contexto de 200K, ele processa as saídas em ambientes isolados.
Como Funciona
O sistema de ambiente isolado cria subprocessos isolados para cada chamada de execução. Os scripts são executados nesses subprocessos com seus próprios limites de processo, e apenas a saída padrão entra no contexto da conversa. Dados brutos como arquivos de log, respostas de API e instantâneos nunca saem do ambiente isolado.
Dez ambientes de execução de linguagens estão disponíveis: JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl e R. Bun é detectado automaticamente para execução de JS/TS 3-5x mais rápida. CLIs autenticados (gh, aws, gcloud, kubectl, docker) funcionam através da passagem de credenciais, onde os subprocessos herdam variáveis de ambiente e caminhos de configuração sem expô-los à conversa.
Recursos da Base de Conhecimento
A ferramenta de indexação divide o conteúdo markdown por títulos mantendo os blocos de código intactos, depois os armazena em uma tabela virtual SQLite FTS5. A busca usa classificação BM25 com stemming Porter aplicado no momento da indexação. Quando você chama a busca, ela retorna blocos de código exatos com sua hierarquia de títulos.
A ferramenta fetch_and_index estende isso para URLs: busca, converte HTML para markdown, divide e indexa. A página bruta nunca entra no contexto.
Benchmarks de Desempenho
- Instantâneo do Playwright: 56 KB → 299 B
- Problemas do GitHub (20): 59 KB → 1,1 KB
- Log de acesso (500 requisições): 45 KB → 155 B
- CSV de análise (500 linhas): 85 KB → 222 B
- Log do Git (153 commits): 11,6 KB → 107 B
- Pesquisa de repositório (subagente): 986 KB → 62 KB (5 chamadas vs 37)
Em uma sessão completa: 315 KB de saída bruta se tornam 5,4 KB. O tempo da sessão antes da desaceleração vai de ~30 minutos para ~3 horas. Contexto restante após 45 minutos: 99% em vez de 60%.
Instalação
Dois métodos de instalação:
- Mercado de Plugins:
/plugin marketplace add mksglu/claude-context-modedepois/plugin install context-mode@claude-context-mode - Apenas MCP:
claude mcp add context-mode -- npx -y context-mode
Após a instalação, reinicie o Claude Code. Context Mode inclui um hook PreToolUse que roteia automaticamente as saídas das ferramentas através do ambiente isolado. Subagentes aprendem a usar batch_execute como sua ferramenta principal, e subagentes bash são atualizados para propósito geral para que possam acessar ferramentas MCP.
A ferramenta é de código aberto sob licença MIT em github.com/mksglu/claude-context-mode.
📖 Leia a fonte completa: HN LLM Tools
👀 See Also
Pesquisador Desenvolve Habilidade de Verificação de Veracidade para Código Claude, Encontra Alucinações na Própria Documentação
Um pesquisador criou uma habilidade Claude Code chamada /veracity-tweaked-555 que decompõe documentos em afirmações atômicas e verifica cada uma via busca na web usando 16 agentes paralelos em 4 ondas. Quando autoauditada, a habilidade marcou 62/100 devido a estatísticas fabricadas e afirmações infladas em sua própria documentação.

Tessera: Ambiente de Trabalho GUI de Código Aberto para Gerenciar Múltiplas Sessões do Claude Code
Tessera é uma GUI open-source que permite executar várias sessões do Claude Code lado a lado com isolamento de Git worktree, rastreamento de tarefas no estilo Kanban, diffs ao vivo e inspeção de atividades do agente.

MCP Memory Gateway: Um Servidor MCP para Memória Persistente no Claude Code
Um desenvolvedor criou um servidor MCP chamado MCP Memory Gateway usando o Claude Code como ferramenta principal de desenvolvimento. Ele fornece ao Claude Code memória persistente entre sessões através da captura de feedback, regras de prevenção e injeção de contexto.

Habilidade de autocura de código aberto para agentes de IA detecta e corrige falhas automaticamente.
Uma nova habilidade de código aberto permite que agentes de IA detectem automaticamente falhas, diagnostiquem causas raiz e implementem correções. Inclui um scanner de falhas para crons, subagentes e logs de implantação, além de um banco de dados que aprende com correções anteriores.