Отладка тайм-утов OpenClaw + Ollama (локальная модель): пять решений для тихих сбоев

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Отладка тайм-утов OpenClaw + Ollama (локальная модель): пять решений для тихих сбоев
Ad

Проблема: Агенты OpenClaw беззвучно зависают с локальными моделями Ollama

Разработчик, отлаживающий OpenClaw 2026.4.2 с Ollama 0.20.2 и моделью Gemma 4 26B-A4B Q8_0 на Mac Studio M4 Max, обнаружил, что агенты не отвечают после команды /new, несмотря на мгновенную работу модели через ollama run. В логах не появлялись ошибки, и агент не показывал индикатор набора текста.

Основные причины и исправления

  • Основная причина №1: Блокировка генератором слагов: Хук session-memory в OpenClaw запускает генератор слагов, который отправляет запрос в Ollama с жёстко заданным таймаутом в 15 секунд. Если модель не успевает обработать системный промпт OpenClaw за это время, OpenClaw отменяет запрос, но Ollama продолжает его обработку, блокируя последующие запросы агентов.
    Исправление: openclaw hooks disable session-memory
  • Основная причина №2: Большой системный промпт: OpenClaw добавляет примерно 38 500 символов системного промпта (идентификация, инструменты, загрузочные файлы) в каждый запрос. Локальным моделям требуется 40-60 секунд для фазы предварительного заполнения.
    Исправление: Добавить в конфигурацию для пропуска загрузочной инъекции и ограничения символов:
    { "agents": { "defaults": { "skipBootstrap": true, "bootstrapTotalMaxChars": 500 } } }
    Это сокращает промпт до ~19 тысяч символов.
  • Основная причина №3: Скрытый таймаут простоя: В OpenClaw есть параметр DEFAULT_LLM_IDLE_TIMEOUT_MS со значением 60 секунд. Если модель не генерирует первый токен за это время, соединение разрывается, и происходит беззвучный переход на резервную модель (например, Claude Sonnet).
    Исправление: Установить недокументированный ключ конфигурации:
    { "agents": { "defaults": { "llm": { "idleTimeoutSeconds": 300 } } } }
  • Основная причина №4: Последовательная обработка в Ollama: Ollama обрабатывает запросы последовательно, поэтому отменённые запросы генератора слагов могут занимать слоты обработки.
    Исправление: Добавить в конфигурацию службы/plist Ollama: OLLAMA_NUM_PARALLEL=4
  • Основная причина №5: Задержка режима размышления: Gemma 4 по умолчанию использует фазу размышления/рассуждения, которая добавляет 20-30 секунд перед первым токеном.
    Исправление: Отключить в конфигурации:
    { "agents": { "defaults": { "thinkingDefault": "off" } } }
Ad

Полная рабочая конфигурация

Разработчик предоставил эту полную конфигурацию для рабочей настройки:

{ "agents": { "defaults": { "model": { "primary": "ollama/gemma4:26b-a4b-it-q8_0", "fallbacks": ["anthropic/claude-sonnet-4-6"] }, "thinkingDefault": "off", "timeoutSeconds": 600, "skipBootstrap": true, "bootstrapTotalMaxChars": 500, "llm": { "idleTimeoutSeconds": 300 } } } }

Дополнительно, закрепите модель в памяти, чтобы предотвратить её выгрузку между запросами:

curl http://localhost:11434/api/generate -d '{"model":"gemma4:26b-a4b-it-q8_0","keep_alive":-1,"options":{"num_ctx":16384}}'

Результаты и компромиссы

После применения исправлений первое сообщение после /new занимает около 60 секунд из-за предварительного заполнения системного промпта, что описывается как неизбежное для локальных моделей. Последующие сообщения выполняются быстро, потому что Ollama кэширует состояние KV. Настройка использует 31 ГБ видеопамяти, 100% GPU и окно контекста в 16 тысяч токенов, работая полностью локально без затрат на API.

Начальная задержка — это компромисс за полностью локальную работу, конфиденциальность и отсутствие затрат. Разработчик отмечает, что это того стоит, если эти факторы являются приоритетными.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Исправление ошибки 'Служба виртуальной машины не запущена' в Cowork на Windows 11
Гайды

Исправление ошибки 'Служба виртуальной машины не запущена' в Cowork на Windows 11

Пользователь Reddit делится командой PowerShell для исправления ошибки 'Служба виртуальной машины не запущена' в Cowork, когда Hyper-V установлен, но гипервизор не запускается при загрузке. Решение включает проверку hypervisorlaunchtype и установку его значения в auto.

OpenClawRadar
Четыре способа переноса истории ChatGPT в память Claude
Гайды

Четыре способа переноса истории ChatGPT в память Claude

Claude теперь предлагает импорт памяти для данных ChatGPT, но есть четыре подхода с разными компромиссами: встроенный импорт для скорости, курируемая абстракция для контроля, полный экспорт для сохранения или гибридный метод, сочетающий все три.

OpenClawRadar
Миграция агентов OpenClaw на Claude Code после прекращения поддержки сторонних оболочек
Гайды

Миграция агентов OpenClaw на Claude Code после прекращения поддержки сторонних оболочек

Разработчик перенёс 17 агентов OpenClaw на Claude Code за один день после того, как Anthropic прекратила поддержку сторонних оболочек. Процесс включал создание точек входа CLAUDE.md, bash-обёрток и cron-заданий с сохранением существующей логики агентов.

OpenClawRadar
Исследования показывают, что эффективное взаимодействие с ИИ — это совместная коммуникация, а не инженерия.
Гайды

Исследования показывают, что эффективное взаимодействие с ИИ — это совместная коммуникация, а не инженерия.

Рецензируемые исследования показывают, что эффективное промптирование с моделями ИИ следует тем же принципам кооперативной коммуникации, которые используют люди. Анализ компании Lakera демонстрирует, что большинство неудач с промтами проистекает из неоднозначности, а не из ограничений модели.

OpenClawRadar