Correção de Timeout do OpenClaw LLM para Carregamento de Modelo Frio

Problema: Timeouts de Modelo Frio em 60 Segundos
Usuários relataram que modelos locais carregados a frio no OpenClaw falhavam consistentemente após aproximadamente 60 segundos, apesar de terem o timeout geral do agente configurado para um valor muito maior. Esse problema também ocorria com modelos em nuvem via Ollama e, às vezes, com o OpenAI Codex.
O padrão típico de falha:
- Modelos funcionam se já estiverem aquecidos
- Modelos frios param de funcionar por volta de ~60 segundos
- Logs mencionam timeout / failover incorporado / status: 408
- Modelo de fallback assume o controle
Configurações Enganosas
A fonte alerta que várias opções de configuração óbvias NÃO são a solução real e podem levar os desenvolvedores ao caminho errado:
agents.defaults.timeoutSeconds- exports do
.zshrc LLM_REQUEST_TIMEOUT- Culpar imediatamente o LM Studio / Ollama
Causa Raiz
O problema surge porque o OpenClaw tem um timeout de inatividade do LLM do embedded-runner separado para o período antes do modelo emitir o primeiro token transmitido.
Rastreamento da fonte encontrado em:
src/agents/pi-embedded-runner/run/llm-idle-timeout.ts
Valor padrão:
DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000
O caminho de configuração é resolvido a partir de:
cfg?.agents?.defaults?.llm?.idleTimeoutSeconds
Portanto, o parâmetro de configuração real é:
agents.defaults.llm.idleTimeoutSeconds
A Correção
Após testes, a configuração que funciona é:
{
"agents": {
"defaults": {
"llm": {
"idleTimeoutSeconds": 180
}
}
}
}
Testes mostraram que uma chamada fria ao Gemma, que anteriormente falhava por volta de 60 segundos, sobreviveu além desse limite e eventualmente respondeu com sucesso sem failover imediato.
Configuração Permanente Recomendada
{
"agents": {
"defaults": {
"timeoutSeconds": 300,
"llm": {
"idleTimeoutSeconds": 300
}
}
}
}
A recomendação de 300 segundos leva em conta que modelos locais são imprevisíveis, onde failovers falsos são mais problemáticos do que esperar mais tempo por modelos genuinamente frios.
📖 Leia a fonte completa: r/openclaw
👀 See Also

Programe Bots de IA para Batalhar contra Humanos em um Novo Jogo Multijogador
Um novo jogo multiplayer permite que os jogadores programem bots de IA para competir contra jogadores humanos em tempo real, oferecendo uma combinação única de desafios de programação e jogabilidade.

Corrigindo as Alucinações Temporais do Claude no Código do Claude com Hooks
Um usuário descobriu que o Claude Code não tem acesso ao relógio em tempo real, fazendo com que ele sugira incorretamente ações como 'descanse um pouco' em momentos inadequados. A correção envolve adicionar um hook de uma linha ao arquivo ~/.claude/settings.json que injeta o horário atual no contexto do Claude em cada mensagem.

Enquadrando Conversas de IA em vez de Escrever Prompts Perfeitos
Um desenvolvedor no r/ClaudeAI compartilha sete técnicas práticas para melhorar as respostas do Claude AI, enquadrando conversas com contexto, papéis, consequências e solicitações de julgamento, em vez de focar na formulação perfeita dos prompts.

Gastou US$ 850 no OpenClaw em um Mês? Conserte sua Arquitetura, Não seu Modelo
Um desenvolvedor queimou US$ 850 em um mês com uma configuração multiagente do OpenClaw — com US$ 350 perdidos em um único dia. A solução não foi um modelo mais barato — foi o design do sistema: poda rigorosa de contexto, redefinições de sessão, n8n para tarefas que não exigem raciocínio e uma camada de roteamento para modelos baratos vs. potentes.