Correction du délai d'attente OpenClaw LLM pour le chargement de modèle à froid

Problème : Délais d'attente des modèles froids à 60 secondes
Les utilisateurs ont signalé que les modèles locaux chargés à froid dans OpenClaw échouaient systématiquement après environ 60 secondes, malgré un délai d'attente général de l'agent défini bien plus élevé. Ce problème survenait également avec les modèles cloud via Ollama et parfois avec OpenAI Codex.
Le schéma d'échec typique :
- Les modèles fonctionnent s'ils sont déjà chauds
- Les modèles froids échouent vers ~60 secondes
- Les journaux mentionnent timeout / basculement intégré / statut : 408
- Le modèle de secours prend le relais
Configurations trompeuses
La source avertit que plusieurs options de configuration évidentes ne sont PAS la véritable solution et peuvent orienter les développeurs sur la mauvaise voie :
agents.defaults.timeoutSeconds- Exports
.zshrc LLM_REQUEST_TIMEOUT- Accuser immédiatement LM Studio / Ollama
Cause racine
Le problème provient du fait qu'OpenClaw possède un délai d'attente d'inactivité du LLM de l'embedded-runner distinct pour la période précédant l'émission du premier token en flux continu par le modèle.
Trace source trouvée dans :
src/agents/pi-embedded-runner/run/llm-idle-timeout.ts
Valeur par défaut :
DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000
Le chemin de configuration résout à partir de :
cfg?.agents?.defaults?.llm?.idleTimeoutSeconds
Donc le paramètre de configuration réel est :
agents.defaults.llm.idleTimeoutSeconds
La correction
Après tests, la configuration fonctionnelle est :
{
"agents": {
"defaults": {
"llm": {
"idleTimeoutSeconds": 180
}
}
}
}
Les tests ont montré qu'un appel froid à Gemma qui échouait auparavant vers 60 secondes a survécu au-delà de ce seuil et a finalement répondu avec succès sans basculement immédiat.
Configuration permanente recommandée
{
"agents": {
"defaults": {
"timeoutSeconds": 300,
"llm": {
"idleTimeoutSeconds": 300
}
}
}
}
La recommandation de 300 secondes tient compte du caractère imprévisible des modèles locaux, où les faux basculements sont plus problématiques qu'une attente plus longue pour des modèles véritablement froids.
📖 Lire la source complète : r/openclaw
👀 See Also

Comment réparer les approximations CSS de Claude Code avec un système de design
Un développeur a constaté que Claude Code régénère sans cesse du HTML/CSS mal aligné car il conçoit à l'aveugle sans retour visuel. La solution : fournir un système de design complet avec des variables d'espacement, de couleurs et de typographie, puis séparer les instructions HTML et CSS.

La négociation par incitation est faible : décrivez plutôt explicitement le comportement souhaité
Une analyse Reddit montre que dire à Claude « ne sois pas bavard » ou « ne moralise pas » fonctionne à peine. Utilisez plutôt des instructions positives comme « réponds en 1 à 2 phrases » ou « donne-moi une réponse directe, considère les mises en garde comme facultatives ». Aussi, terminer par « merci ! » adoucit le ton.

Les angles morts des publications sur les flux de travail de Claude Code : Récupération, Contraintes et Gestion des autorisations
Les workflows Claude Code en mode "happy path" sont courants, mais ils négligent la récupération après des modifications erronées, l'application de contraintes et la gestion des permissions, pourtant essentiels en pratique.

Utiliser une incitation de type GAN pour améliorer la pensée critique de Claude
Un utilisateur de Reddit partage une phrase spécifique pour inciter Claude à adopter un cadre de pensée de type GAN, le forçant à critiquer et à tester en profondeur les idées au lieu de fournir des réponses superficielles et conciliantes.