Исправление тайм-аута OpenClaw LLM при холодной загрузке модели

Проблема: Таймауты «холодных» моделей на 60 секундах
Пользователи сообщали, что локальные модели в OpenClaw, загруженные «холодным» способом, стабильно переставали работать примерно через 60 секунд, несмотря на то, что общий таймаут агента был установлен намного выше. Эта проблема также возникала с облачными моделями через Ollama и иногда с OpenAI Codex.
Типичная картина сбоя:
- Модели работают, если уже «разогреты»
- «Холодные» модели перестают работать примерно через ~60 секунд
- В логах упоминается таймаут / отказ встроенного раннера / статус: 408
- Включается резервная модель
Вводящие в заблуждение конфигурации
Источник предупреждает, что несколько очевидных опций конфигурации НЕ являются настоящим решением и могут направить разработчиков по ложному пути:
agents.defaults.timeoutSeconds- Экспорты в
.zshrc LLM_REQUEST_TIMEOUT- Немедленное обвинение LM Studio / Ollama
Коренная причина
Проблема возникает из-за того, что в OpenClaw существует отдельный таймаут простоя LLM во встроенном раннере для периода до того, как модель выдаст первый потоковый токен.
Источник проблемы найден в:
src/agents/pi-embedded-runner/run/llm-idle-timeout.ts
Значение по умолчанию:
DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000
Путь конфигурации определяется из:
cfg?.agents?.defaults?.llm?.idleTimeoutSeconds
Таким образом, фактический параметр конфигурации:
agents.defaults.llm.idleTimeoutSeconds
Решение
После тестирования рабочая конфигурация:
{
"agents": {
"defaults": {
"llm": {
"idleTimeoutSeconds": 180
}
}
}
}
Тестирование показало, что «холодный» вызов Gemma, который ранее завершался сбоем примерно через 60 секунд, преодолел этот порог и в конечном итоге успешно ответил без немедленного переключения на резервную модель.
Рекомендуемая постоянная конфигурация
{
"agents": {
"defaults": {
"timeoutSeconds": 300,
"llm": {
"idleTimeoutSeconds": 300
}
}
}
}
Рекомендация в 300 секунд учитывает непредсказуемость локальных моделей, когда ложные переключения на резервную модель более проблематичны, чем ожидание подлинно «холодных» моделей.
📖 Read the full source: r/openclaw
👀 Смотрите также

Аудит токенов Claude Code выявил скрытые расходы из-за загрузки инструментов по умолчанию.
Разработчик проанализировал 926 сессий Claude Code и обнаружил, что при запуске загружается 45 000 токенов, из которых 20 000 приходятся на определения схем системных инструментов. Включение настройки ENABLE_TOOL_SEARCH сократило начальный контекст с 45 000 до 20 000 токенов, экономя 14 000 токенов за каждый ход.

8 тактических советов по рабочему процессу Claude Code для готового к выпуску результата
Заставляйте задавать уточняющие вопросы, автоматически проверяйте задачи, используйте досрочный выход и применяйте Vision/DevTools для получения готового к продакшену кода от Claude.

Оптимизация CLAUDE.md для снижения контекстной тревожности в Claude AI
Обсуждение на Reddit подчеркивает практические стратегии повышения эффективности CLAUDE.md, включая сохранение файлов менее 200 строк, использование конкретных проверяемых инструкций и использование функций авто-памяти Claude для предотвращения расточительных циклов исправлений.

Агент Claude отправляет мемы через Discord с помощью Tenor GIF — полный протокол
Настройка агента Claude code добавляет контекстно-зависимые эмодзи-реакции, односложные сообщения о статусе и проверенные URL-адреса GIF Tenor в каждое сообщение Discord, с явными шагами веб-поиска и загрузки для избежания неработающих ссылок.