Correção de Timeout do OpenClaw LLM para Carregamento de Modelo Frio

✍️ OpenClawRadar📅 Publicado: April 15, 2026🔗 Source
Correção de Timeout do OpenClaw LLM para Carregamento de Modelo Frio
Ad

Problema: Timeouts de Modelo Frio em 60 Segundos

Usuários relataram que modelos locais carregados a frio no OpenClaw falhavam consistentemente após aproximadamente 60 segundos, apesar de terem o timeout geral do agente configurado para um valor muito maior. Esse problema também ocorria com modelos em nuvem via Ollama e, às vezes, com o OpenAI Codex.

O padrão típico de falha:

  • Modelos funcionam se já estiverem aquecidos
  • Modelos frios param de funcionar por volta de ~60 segundos
  • Logs mencionam timeout / failover incorporado / status: 408
  • Modelo de fallback assume o controle

Configurações Enganosas

A fonte alerta que várias opções de configuração óbvias NÃO são a solução real e podem levar os desenvolvedores ao caminho errado:

  • agents.defaults.timeoutSeconds
  • exports do .zshrc
  • LLM_REQUEST_TIMEOUT
  • Culpar imediatamente o LM Studio / Ollama
Ad

Causa Raiz

O problema surge porque o OpenClaw tem um timeout de inatividade do LLM do embedded-runner separado para o período antes do modelo emitir o primeiro token transmitido.

Rastreamento da fonte encontrado em:

src/agents/pi-embedded-runner/run/llm-idle-timeout.ts

Valor padrão:

DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000

O caminho de configuração é resolvido a partir de:

cfg?.agents?.defaults?.llm?.idleTimeoutSeconds

Portanto, o parâmetro de configuração real é:

agents.defaults.llm.idleTimeoutSeconds

A Correção

Após testes, a configuração que funciona é:

{
  "agents": {
    "defaults": {
      "llm": {
        "idleTimeoutSeconds": 180
      }
    }
  }
}

Testes mostraram que uma chamada fria ao Gemma, que anteriormente falhava por volta de 60 segundos, sobreviveu além desse limite e eventualmente respondeu com sucesso sem failover imediato.

Configuração Permanente Recomendada

{
  "agents": {
    "defaults": {
      "timeoutSeconds": 300,
      "llm": {
        "idleTimeoutSeconds": 300
      }
    }
  }
}

A recomendação de 300 segundos leva em conta que modelos locais são imprevisíveis, onde failovers falsos são mais problemáticos do que esperar mais tempo por modelos genuinamente frios.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Programe Bots de IA para Batalhar contra Humanos em um Novo Jogo Multijogador
Tips

Programe Bots de IA para Batalhar contra Humanos em um Novo Jogo Multijogador

Um novo jogo multiplayer permite que os jogadores programem bots de IA para competir contra jogadores humanos em tempo real, oferecendo uma combinação única de desafios de programação e jogabilidade.

OpenClawRadar
Corrigindo as Alucinações Temporais do Claude no Código do Claude com Hooks
Tips

Corrigindo as Alucinações Temporais do Claude no Código do Claude com Hooks

Um usuário descobriu que o Claude Code não tem acesso ao relógio em tempo real, fazendo com que ele sugira incorretamente ações como 'descanse um pouco' em momentos inadequados. A correção envolve adicionar um hook de uma linha ao arquivo ~/.claude/settings.json que injeta o horário atual no contexto do Claude em cada mensagem.

OpenClawRadar
Enquadrando Conversas de IA em vez de Escrever Prompts Perfeitos
Tips

Enquadrando Conversas de IA em vez de Escrever Prompts Perfeitos

Um desenvolvedor no r/ClaudeAI compartilha sete técnicas práticas para melhorar as respostas do Claude AI, enquadrando conversas com contexto, papéis, consequências e solicitações de julgamento, em vez de focar na formulação perfeita dos prompts.

OpenClawRadar
Gastou US$ 850 no OpenClaw em um Mês? Conserte sua Arquitetura, Não seu Modelo
Tips

Gastou US$ 850 no OpenClaw em um Mês? Conserte sua Arquitetura, Não seu Modelo

Um desenvolvedor queimou US$ 850 em um mês com uma configuração multiagente do OpenClaw — com US$ 350 perdidos em um único dia. A solução não foi um modelo mais barato — foi o design do sistema: poda rigorosa de contexto, redefinições de sessão, n8n para tarefas que não exigem raciocínio e uma camada de roteamento para modelos baratos vs. potentes.

OpenClawRadar