Corrigindo o inchaço de prompts e loops de resposta lentos no OpenClaw

Se o agente principal do OpenClaw está ficando mais lento—minutos antes de agir—a causa raiz provavelmente é o inchaço do contexto, não um bug isolado. Com base em um post detalhado no Reddit, o problema decorre de uma combinação de arquivos de projeto sempre injetados, excesso de habilidades visíveis, grandes esquemas de ferramentas e histórico de conversas que aciona loops de compactação e repetição.
O que estava causando o inchaço
- Contexto de projeto sempre injetado: Arquivos como
AGENTS.md,HEARTBEAT.mdeTOOLS.mdsão enviados a cada turno. Com o tempo, eles se tornaram minimanuais. Tamanhos de exemplo antes:AGENTS.md8.618 bytes,HEARTBEAT.md4.970 bytes,TOOLS.md8.820 bytes (total 22.408 bytes). - Muitas habilidades visíveis: O agente principal tinha 60 habilidades visíveis. O OpenClaw injeta o catálogo de habilidades (nome, descrição, caminho) a cada turno, e as instruções do agente incentivam a verificação da lista de habilidades antes de responder, adicionando sobrecarga e leituras extras de arquivos.
- Esquemas de ferramentas: Definições JSON das ferramentas disponíveis (parâmetros, enums, descrições) são necessárias para o modelo chamar ferramentas, mas cada esquema consome espaço de contexto.
- Histórico de conversa: As chamadas LLM são sem estado, então o OpenClaw reenvia histórico suficiente a cada rodada. Logs gigantescos, saídas enormes de ferramentas e longos rastreamentos de depuração tornam-se parte do fardo.
- Pressão de compactação/repetição: Linha de base grande + histórico grande → compactação → repetições → linha de base fixa ainda grande → permanece lento. A compactação não pode reduzir linhas de base sempre injetadas ou mensagens recentes preservadas.
O que foi alterado
1. Lista de permissões agressiva de habilidades do agente principal
Mudou de 60 habilidades irrestritas para uma pequena lista explícita de 10 diretrizes:
source-grounded-claims
pre-send-check
session-status-claim-check
verify-after-edit
transient-check-failure-disclosure
failed-subagent-results-caveat
gateway-change-guard
openclaw-webui-tailscale-recovery
tailscale-network-guard
long-running-task-guard
2. Redução de arquivos sempre injetados
Compactou AGENTS.md, HEARTBEAT.md e TOOLS.md em arquivos de roteamento/índice em vez de manuais gigantes. Após a compactação:
AGENTS.md 4.804 bytes
HEARTBEAT.md 2.177 bytes
TOOLS.md 2.387 bytes
Total 9.368 bytes
3. Mudança na prática operacional
- Para auditorias e diagnósticos: use subagentes com
lightContext:true. - Salve logs/relatórios grandes em arquivos em vez de colar no chat principal.
- Resuma as descobertas na sessão principal; não cole logs/saídas de ferramentas gigantes.
- Use
tail,grep,sed -nlimitados para inspecionar arquivos sem despejar o conteúdo completo.
Essas alterações abordam diretamente o ciclo de realimentação onde carregar tudo antes de cada turno causava compactação e atrasos. A versão específica mencionada é 2026.4.26, mas o conselho se aplica a qualquer configuração do OpenClaw que esteja enfrentando inchaço semelhante.
📖 Leia a fonte completa: r/openclaw
👀 See Also

OpenClaw Manual de Jogadas Multiagente: 7 Agentes Isolados por 5/Mês
Guia completo de arquitetura para executar agentes de IA especializados com memória focada, permissões de privilégio mínimo e roteamento inteligente de modelos.

Tópico da Comunidade OpenClaw: Compartilhe Sua Configuração de Programação em IA e Custos Mensais
Uma discussão no Reddit na comunidade r/openclaw reúne configurações práticas para agentes de IA de codificação, focando em estratégias de roteamento de modelos, regras de economia de custos e mapeamentos hardware-modelo fornecidos pela comunidade com faixas de custo mensal.

DeepSeek-V4-Flash W4A16+FP8 com MTP Autospeculação: 85 tok/s em 2x RTX PRO 6000 Max-Q
DeepSeek-V4-Flash quantizado para W4A16+FP8 alcança 85.52 tok/s em contexto de 524k em 2× RTX PRO 6000 Max-Q usando um vLLM modificado com cabeça MTP adaptada, contra 52.85 tok/s da linha de base.

Claude vs GPT para Escrita Acadêmica de Doutorado: Preservando o Significado Técnico em Seções de Métodos
Um candidato a PhD compara Claude e GPT para polir artigos de co-design de visão computacional / hardware, descobrindo que Claude é mais confiável para preservar o significado técnico e a estrutura argumentativa, enquanto GPT às vezes simplifica demais as afirmações.