Отладка тайм-утов OpenClaw + Ollama (локальная модель): пять решений для тихих сбоев

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source

Проблема: Агенты OpenClaw беззвучно зависают с локальными моделями Ollama

Разработчик, отлаживающий OpenClaw 2026.4.2 с Ollama 0.20.2 и моделью Gemma 4 26B-A4B Q8_0 на Mac Studio M4 Max, обнаружил, что агенты не отвечают после команды /new, несмотря на мгновенную работу модели через ollama run. В логах не появлялись ошибки, и агент не показывал индикатор набора текста.

Основные причины и исправления

Основная причина №1: Блокировка генератором слагов: Хук session-memory в OpenClaw запускает генератор слагов, который отправляет запрос в Ollama с жёстко заданным таймаутом в 15 секунд. Если модель не успевает обработать системный промпт OpenClaw за это время, OpenClaw отменяет запрос, но Ollama продолжает его обработку, блокируя последующие запросы агентов.
Исправление: openclaw hooks disable session-memory
Основная причина №2: Большой системный промпт: OpenClaw добавляет примерно 38 500 символов системного промпта (идентификация, инструменты, загрузочные файлы) в каждый запрос. Локальным моделям требуется 40-60 секунд для фазы предварительного заполнения.
Исправление: Добавить в конфигурацию для пропуска загрузочной инъекции и ограничения символов:
```
{ "agents": { "defaults": { "skipBootstrap": true, "bootstrapTotalMaxChars": 500 } } }
```
Это сокращает промпт до ~19 тысяч символов.
Основная причина №3: Скрытый таймаут простоя: В OpenClaw есть параметр DEFAULT_LLM_IDLE_TIMEOUT_MS со значением 60 секунд. Если модель не генерирует первый токен за это время, соединение разрывается, и происходит беззвучный переход на резервную модель (например, Claude Sonnet).
Исправление: Установить недокументированный ключ конфигурации:
```
{ "agents": { "defaults": { "llm": { "idleTimeoutSeconds": 300 } } } }
```
Основная причина №4: Последовательная обработка в Ollama: Ollama обрабатывает запросы последовательно, поэтому отменённые запросы генератора слагов могут занимать слоты обработки.
Исправление: Добавить в конфигурацию службы/plist Ollama: OLLAMA_NUM_PARALLEL=4
Основная причина №5: Задержка режима размышления: Gemma 4 по умолчанию использует фазу размышления/рассуждения, которая добавляет 20-30 секунд перед первым токеном.
Исправление: Отключить в конфигурации:
```
{ "agents": { "defaults": { "thinkingDefault": "off" } } }
```

Полная рабочая конфигурация

Разработчик предоставил эту полную конфигурацию для рабочей настройки:

{ "agents": { "defaults": { "model": { "primary": "ollama/gemma4:26b-a4b-it-q8_0", "fallbacks": ["anthropic/claude-sonnet-4-6"] }, "thinkingDefault": "off", "timeoutSeconds": 600, "skipBootstrap": true, "bootstrapTotalMaxChars": 500, "llm": { "idleTimeoutSeconds": 300 } } } }

Дополнительно, закрепите модель в памяти, чтобы предотвратить её выгрузку между запросами:

curl http://localhost:11434/api/generate -d '{"model":"gemma4:26b-a4b-it-q8_0","keep_alive":-1,"options":{"num_ctx":16384}}'

Результаты и компромиссы

После применения исправлений первое сообщение после /new занимает около 60 секунд из-за предварительного заполнения системного промпта, что описывается как неизбежное для локальных моделей. Последующие сообщения выполняются быстро, потому что Ollama кэширует состояние KV. Настройка использует 31 ГБ видеопамяти, 100% GPU и окно контекста в 16 тысяч токенов, работая полностью локально без затрат на API.

Начальная задержка — это компромисс за полностью локальную работу, конфиденциальность и отсутствие затрат. Разработчик отмечает, что это того стоит, если эти факторы являются приоритетными.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Гайды

OpenClaw Memory Journey: Встроенный поиск против MemPalace для мгновенного воспроизведения сессий

Разработчик тестирует встроенный memorySearch, QMD и MemPalace на Intel Mac. Индексация в реальном времени дает сбои; в итоге выбрана стратегия раздельного извлечения с переиндексацией по cron.

29 июн. 2026 г., 00:17 UTC

OpenClawRadar

Гайды

Разработчик делится 25 проверенными промтами для Claude, оптимизированными для рабочих процессов SaaS-разработки.

Разработчик поделился 25 конкретными промптами, которые он использует ежедневно для разработки SaaS-продуктов, охватывая бэкенд-архитектуру, проектирование API, тексты для фронтенда, документацию продукта и задачи выхода на рынок. Эти промпты предназначены для экономии времени на повторяющихся задачах, таких как ревью кода, генерация документации и тестирование граничных случаев.

16 мар. 2026 г., 03:45 UTC

OpenClawRadar

Гайды

Освоение OpenClaw 101: Руководство для начинающих, вдохновленное идеями пользователей Reddit.

Погрузитесь в OpenClaw с нашим практическим руководством, вдохновленным мнениями сообщества Reddit. Избегайте распространенных ошибок и повышайте свою продуктивность с помощью этих экспертных советов.

9 февр. 2026 г., 15:07 UTC

OpenClawRadar

Гайды

Обработка отключений шлюза для эффективной автоматизации

Изучите практические решения для поддержания работы AI-кодирующих агентов при отключении шлюзов. Рекомендации включают мониторинг с помощью Grafana, автоматические сценарии переподключения и использование избыточных путей для обеспечения надежности.

20 апр. 2026 г., 17:38 UTC

OpenClawRadar