Problemas de Compactação de Sessão do Claude AI e Soluções Alternativas

✍️ OpenClawRadar📅 Publicado: March 17, 2026🔗 Source
Problemas de Compactação de Sessão do Claude AI e Soluções Alternativas
Ad

Como a Compactação Funciona

As sessões do Claude são armazenadas como arquivos JSONL em ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl. Cada turno de conversa é um bloco JSON. Quando a compactação é acionada, os blocos originais permanecem no arquivo, mas um novo bloco com um resumo compactado é anexado. Após a compactação, o modelo trabalha a partir do resumo em vez do histórico completo da conversa.

Resultados dos Testes

Com um projeto de programação em 90% de preenchimento de contexto (antes do aumento para 1 milhão de tokens), o usuário testou 10 questões cobrindo recuperação simples, cadeias de dependência de 6 saltos, desambiguação de entidades, encadeamento de negações, detecção de ausência e detecção de conflitos.

  • Pré-compactação: ~9,75/10 de precisão com Opus 4.6 encontrando fatos dispersos em 418 mil tokens
  • Pós-compactação (Padrão): ~5/10 de precisão com 3.461 tokens (compactação de 121x). A mesma sessão, as mesmas questões resultaram em respostas incorretas alucinadas.
  • Pós-compactação (Manual Opus): ~9,75/10 de precisão com 6.080 tokens (compactação de 69x). Usar um prompt de compactação personalizado com Opus preservou informações importantes.
Ad

Por que a Diferença

De acordo com a documentação da Anthropic, a API usa por padrão o mesmo modelo para compactação. O usuário estava executando Opus 4.6 em computação média, então a compactação padrão deveria ter usado Opus também. A diferença de qualidade sugere problemas com o prompt de sumarização, o orçamento de pensamento/computação, ou ambos.

Soluções Alternativas

Abordagem 1: Compactação Opus - Desative a compactação automática e implemente um processo em segundo plano que mede a contagem de tokens para instâncias do Claude Code. Acione a compactação usando Opus com um prompt personalizado (potencialmente com autorização do usuário).

Abordagem 2: Pré-preenchimento com spaCy NER - Em vez de iniciar subagentes com contexto zero, use spaCy NER para extrair nomes próprios, números, nomes de serviços, portas e identificadores-chave dos arquivos do projeto. Injete isso como um briefing leve de entidades (algumas centenas de tokens) na inicialização para informar os agentes sobre recursos existentes sem inflar a narrativa.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

Transforme Sua Base de Conhecimento em um Wiki + Servidor MCP para Claude
Tools

Transforme Sua Base de Conhecimento em um Wiki + Servidor MCP para Claude

Uma demonstração de como a Akyn transforma uma base de conhecimento (URL, PDF, Notion) em uma wiki e a expõe como um servidor MCP, permitindo que o Claude consulte e escreva de volta — com OAuth, humano no loop e sincronização automática.

OpenClawRadar
ClaudyBro: Terminal Nativo do macOS para Fluxos de Trabalho de Código do Claude
Tools

ClaudyBro: Terminal Nativo do macOS para Fluxos de Trabalho de Código do Claude

ClaudyBro é um aplicativo nativo de terminal Swift de 3,5 MB construído especificamente para usuários do Claude Code, com recursos de colagem de imagens, inspeção de processos, limpeza de órfãos e gerenciamento inteligente de MCP. Ele usa 68 MB de memória em idle e 82 MB com o Claude em execução.

OpenClawRadar
Xiaozhen: Uma habilidade de código Claude que investiga três camadas até as causas raiz.
Tools

Xiaozhen: Uma habilidade de código Claude que investiga três camadas até as causas raiz.

Xiaozhen (小真) é uma habilidade do Claude Code que usa três mecânicas — O Presente, Três Camadas de Profundidade e A Previsão — para ajudar os usuários a descobrir o que realmente os incomoda, em vez de dar conselhos diretos. É instalada com um comando curl de uma linha e ativada digitando /小真 no Claude Code.

OpenClawRadar
Código aberto Claude Code habilidade diagnostica obstáculos na adoção de IA
Tools

Código aberto Claude Code habilidade diagnostica obstáculos na adoção de IA

Uma habilidade Claude Code licenciada pelo MIT analisa onde as empresas travam na adoção de IA — ferramentas, cultura ou medição — e cria planos de 90 dias com responsáveis nomeados. Baseado em entrevistas com mais de 100 fundadores e membros de conselho.

OpenClawRadar