Corrigir Timeout OpenClaw LLM: Carregamento a Frio

Problema: Timeouts de Modelo Frio em 60 Segundos

Usuários relataram que modelos locais carregados a frio no OpenClaw falhavam consistentemente após aproximadamente 60 segundos, apesar de terem o timeout geral do agente configurado para um valor muito maior. Esse problema também ocorria com modelos em nuvem via Ollama e, às vezes, com o OpenAI Codex.

O padrão típico de falha:

Modelos funcionam se já estiverem aquecidos
Modelos frios param de funcionar por volta de ~60 segundos
Logs mencionam timeout / failover incorporado / status: 408
Modelo de fallback assume o controle

Configurações Enganosas

A fonte alerta que várias opções de configuração óbvias NÃO são a solução real e podem levar os desenvolvedores ao caminho errado:

agents.defaults.timeoutSeconds
exports do .zshrc
LLM_REQUEST_TIMEOUT
Culpar imediatamente o LM Studio / Ollama

Causa Raiz

O problema surge porque o OpenClaw tem um timeout de inatividade do LLM do embedded-runner separado para o período antes do modelo emitir o primeiro token transmitido.

Rastreamento da fonte encontrado em:

src/agents/pi-embedded-runner/run/llm-idle-timeout.ts

Valor padrão:

DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000

O caminho de configuração é resolvido a partir de:

cfg?.agents?.defaults?.llm?.idleTimeoutSeconds

Portanto, o parâmetro de configuração real é:

agents.defaults.llm.idleTimeoutSeconds

A Correção

Após testes, a configuração que funciona é:

{
  "agents": {
    "defaults": {
      "llm": {
        "idleTimeoutSeconds": 180
      }
    }
  }
}

Testes mostraram que uma chamada fria ao Gemma, que anteriormente falhava por volta de 60 segundos, sobreviveu além desse limite e eventualmente respondeu com sucesso sem failover imediato.

Configuração Permanente Recomendada

{
  "agents": {
    "defaults": {
      "timeoutSeconds": 300,
      "llm": {
        "idleTimeoutSeconds": 300
      }
    }
  }
}

A recomendação de 300 segundos leva em conta que modelos locais são imprevisíveis, onde failovers falsos são mais problemáticos do que esperar mais tempo por modelos genuinamente frios.

📖 Leia a fonte completa: r/openclaw