OpenClaw v2026.3.13 adiciona configuração de cacheRetention por agente para economia de custos com tokens da OpenAI.

✍️ OpenClawRadar📅 Publicado: March 14, 2026🔗 Source
OpenClaw v2026.3.13 adiciona configuração de cacheRetention por agente para economia de custos com tokens da OpenAI.
Ad

O que mudou na v2026.3.13

A versão 2026.3.13 do OpenClaw adicionou validação de configuração adequada para params.cacheRetention em entradas por agente. Isso permite que você defina a retenção de cache de forma declarativa no seu arquivo de configuração openclaw.json.

O problema com o comportamento padrão do cache

A OpenAI suporta retenção estendida de cache de prompt (24 horas) via prompt_cache_retention: "24h" em sua API, que mantém o prefixo do seu prompt em cache por 24 horas em vez dos 5-10 minutos padrão. Tokens de entrada em cache são cobrados com 50% de desconto.

Se você está executando agentes em ciclos de heartbeat maiores que 10 minutos (que a fonte observa ser "basicamente todo mundo"), seu cache fica completamente frio entre cada turno. Isso significa que você está pagando preço cheio por todo o contexto de entrada em cada heartbeat.

A fonte descreve uma configuração com 15 agentes no GPT-5.2 com heartbeats a cada 60-90 minutos onde cada heartbeat era um início frio garantido. O prompt do sistema, contexto de inicialização, HEARTBEAT.md, AGENTS.md, SOUL.md, definições de ferramentas — tudo isso era reenviado a preço cheio a cada ciclo porque o cache expirava no intervalo entre os heartbeats.

Como configurar

Agora você pode definir a retenção de cache no seu openclaw.json:

{
  "agents": {
    "list": [
      {
        "agentId": "my-agent",
        "params": {
          "cacheRetention": "long"
        }
      }
    ]
  }
}

O valor "long" mapeia para o prompt_cache_retention: "24h" da OpenAI através da biblioteca pi-ai.

Ad

Observação importante: patch de runtime necessário

A função resolveCacheRetention() do OpenClaw tem uma cláusula de proteção que bloqueia provedores da OpenAI por padrão. Ela só permite Anthropic e Bedrock. Então, mesmo com a configuração definida, o valor é filtrado antes de chegar à API.

Você precisa do patch de runtime do issue #27515 para fazer funcionar. O patch adiciona a OpenAI à lista de provedores permitidos na cláusula de proteção. Sem tanto a configuração QUANTO o patch, nada acontece.

O autor da fonte observa que tinha o patch aplicado por semanas mas nunca definiu o valor da configuração — significando que o patch estava verificando extraParams?.cacheRetention !== void 0, obtendo undefined, e ainda bloqueando a OpenAI. O patch não estava fazendo nada sem a configuração.

Potencial de economia de custos

Com 15 agentes fazendo heartbeats, cada um enviando ~128K-170K tokens de entrada por turno:

  • Sem cache de 24h: 100% dos tokens de entrada a preço cheio, a cada turno. O cache morre no intervalo de ~60-90 min entre heartbeats.
  • Com cache de 24h: O prefixo estável (prompt do sistema, configuração do agente, definições de ferramentas — tipicamente 80-90% da entrada) permanece em cache entre heartbeats. Esses tokens são cobrados com metade do preço.

Em um sistema executando 15 agentes durante um dia de trabalho completo, são centenas de ciclos de heartbeat por dia onde a maior parte dos tokens de entrada muda de preço cheio para metade do preço. A redução de custo de entrada se acumula rapidamente.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Claude funciona melhor como revisor de código do que como gerador
Tips

Claude funciona melhor como revisor de código do que como gerador

Um desenvolvedor compartilha que o Claude Code produz resultados mais fundamentados quando usado para revisar código existente em vez de gerar do zero. As práticas principais incluem iniciar sessões com implementações atuais, manter arquivos de contexto do projeto e reiniciar sessões quando as respostas se degradam.

OpenClawRadar
Claude Code Visual: Notas Práticas sobre Hooks, Subagentes, MCP e CLAUDE.md
Tips

Claude Code Visual: Notas Práticas sobre Hooks, Subagentes, MCP e CLAUDE.md

Um desenvolvedor compartilha experiência prática usando o Claude Code Visual, abordando sintaxe de ganchos MCP, CLAUDE.md para contexto de projeto, padrões de delegação de subagentes e o comando /loop para tarefas recorrentes.

OpenClawRadar
Como Parar de Atingir os Limites do Claude: Trate Cada Sessão como um Orçamento de Tokens
Tips

Como Parar de Atingir os Limites do Claude: Trate Cada Sessão como um Orçamento de Tokens

Usuário compartilha como resolveu os limites diários do Claude interrompendo a inflação de mensagens — defina o escopo da tarefa, carregue apenas o contexto relevante, limpe após cada sessão. Inclui workflow prático e infográfico.

OpenClawRadar
Dicas de Instalação do OpenClaw: Pular a Integração e Usar Comandos de Diagnóstico
Tips

Dicas de Instalação do OpenClaw: Pular a Integração e Usar Comandos de Diagnóstico

Um usuário do Reddit compartilha conselhos práticos de instalação do OpenClaw: pule o processo de integração para evitar problemas comuns, especialmente em configurações VPS, e use os comandos openclaw doctor e openclaw status para diagnosticar problemas de configuração.

OpenClawRadar