OpenClaw LLM-Timeout-Fix für kalte Modelle

Problem: Timeouts bei kalten Modellen nach 60 Sekunden

Benutzer berichteten, dass kalt geladene lokale Modelle in OpenClaw konsistent nach etwa 60 Sekunden versagten, obwohl das allgemeine Agent-Timeout viel höher eingestellt war. Dieses Problem trat auch mit Cloud-Modellen über Ollama und manchmal mit OpenAI Codex auf.

Das typische Fehlermuster:

Modelle funktionieren, wenn sie bereits warm sind
Kalte Modelle brechen nach ~60 Sekunden ab
Logs erwähnen Timeout / eingebettetes Failover / Status: 408
Fallback-Modell übernimmt

Irreführende Konfigurationen

Die Quelle warnt davor, dass mehrere offensichtliche Konfigurationsoptionen NICHT die eigentliche Lösung sind und Entwickler in die falsche Richtung lenken können:

agents.defaults.timeoutSeconds
.zshrc Exports
LLM_REQUEST_TIMEOUT
Sofortiges Beschuldigen von LM Studio / Ollama

Ursache

Das Problem rührt daher, dass OpenClaw ein separates eingebettetes Runner-LLM-Leerlauf-Timeout für die Zeit vor der Ausgabe des ersten gestreamten Tokens durch das Modell hat.

Quellenspur gefunden in:

src/agents/pi-embedded-runner/run/llm-idle-timeout.ts

Standardwert:

DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000

Der Konfigurationspfad wird aufgelöst von:

cfg?.agents?.defaults?.llm?.idleTimeoutSeconds

Der tatsächliche Konfigurationsparameter ist also:

agents.defaults.llm.idleTimeoutSeconds

Die Lösung

Nach Tests ist die funktionierende Konfiguration:

{
  "agents": {
    "defaults": {
      "llm": {
        "idleTimeoutSeconds": 180
      }
    }
  }
}

Tests zeigten, dass ein kalter Gemma-Aufruf, der zuvor nach etwa 60 Sekunden fehlschlug, diese Schwelle überlebte und schließlich erfolgreich antwortete, ohne sofortiges Failover.

Empfohlene dauerhafte Konfiguration

{
  "agents": {
    "defaults": {
      "timeoutSeconds": 300,
      "llm": {
        "idleTimeoutSeconds": 300
      }
    }
  }
}

Die Empfehlung von 300 Sekunden berücksichtigt, dass lokale Modelle unvorhersehbar sein können, wobei falsche Failovers problematischer sind als längeres Warten auf wirklich kalte Modelle.

📖 Read the full source: r/openclaw