Исправление maxTokens Ollama Cloud: реальный лимит 16 384

PSA для всех, кто видит unexpected EOF от агентов на продакшене: если в вашем openclaw.json есть облачные модели вида { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, этот maxTokens не соответствует реальности. Ollama Cloud на стороне сервера ограничивает вывод 16 384 токенами независимо от вашей настройки. Когда агент пытается выдать что-то сверх этого лимита, сервер обрывает соединение на полпути, и вы видите транспортную ошибку от ollama.com:443. OpenClaw воспринимает это как таймаут и переключается на резервный канал, если он настроен; но если резервный канал тоже использует :cloud модель, то вы столкнетесь с тем же ограничением.

Что помогло

Исправить maxTokens для облачных записей, чтобы OpenClaw не запрашивал бюджет вывода, который сервис не обеспечит:
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k, а не 16k — оставляет небольшой запас, так как модели иногда ведут себя странно у самого предела.
Реструктурировать большие структурированные выводы (длинный JSON, многосекционный контент): выдавать по одной секции за раз вместо пакетной отправки. Это помогает оставаться под лимитом, а повторные попытки становятся чище.
Маршрутизировать тяжелые агенты напрямую к провайдеру через переопределение модели для конкретного агента в agents.list[], вместо использования :cloud. Агенты с небольшим выводом оставьте на Ollama Cloud. Одноразовая настройка:
openclaw onboard --auth-choice deepseek-api-key
Затем в agents.list переопределите нуждающихся:
"list": [ { "id": "your-agent", "model": "deepseek/deepseek-v4-pro" } ]
Компромисс: оплата за токен вместо фиксированной платы, но применяется только к агентам, которым нужно больше пространства.

Вывод

Если ваши агенты сбоят на середине длинных выводов, и вы проверили очевидные вещи, обратите внимание на фактический лимит вывода вашего провайдера, прежде чем углубляться в кроличью нору поиска багов OpenClaw. Сообщение об ошибке бесполезно, а поле конфигурации не сообщает, что оно переопределяется сервером.

📖 Читать полный источник: r/openclaw

Исправление maxTokens модели Ollama Cloud: лимит 16K, а не значение конфигурации

Что помогло

Вывод

👀 Смотрите также

Шаблоны кода превосходят руководства по ИИ: перенос расширения Firefox в Chrome

Отчет с поля: Qwen 3.6 27B на M2 MacBook Pro (32GB) – мучительно медленно, но умный вывод

Сокращение использования токенов MCP за счёт замены серверов на альтернативы CLI

Как перестать сталкиваться с лимитами Клода: относитесь к каждой сессии как к бюджету токенов