Исправление maxTokens модели Ollama Cloud: лимит 16K, а не значение конфигурации

✍️ OpenClawRadar📅 Опубликовано: 3 июня 2026 г.🔗 Source
Исправление maxTokens модели Ollama Cloud: лимит 16K, а не значение конфигурации
Ad

PSA для всех, кто видит unexpected EOF от агентов на продакшене: если в вашем openclaw.json есть облачные модели вида { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, этот maxTokens не соответствует реальности. Ollama Cloud на стороне сервера ограничивает вывод 16 384 токенами независимо от вашей настройки. Когда агент пытается выдать что-то сверх этого лимита, сервер обрывает соединение на полпути, и вы видите транспортную ошибку от ollama.com:443. OpenClaw воспринимает это как таймаут и переключается на резервный канал, если он настроен; но если резервный канал тоже использует :cloud модель, то вы столкнетесь с тем же ограничением.

Ad

Что помогло

  • Исправить maxTokens для облачных записей, чтобы OpenClaw не запрашивал бюджет вывода, который сервис не обеспечит:
    { "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
    { "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
    14k, а не 16k — оставляет небольшой запас, так как модели иногда ведут себя странно у самого предела.
  • Реструктурировать большие структурированные выводы (длинный JSON, многосекционный контент): выдавать по одной секции за раз вместо пакетной отправки. Это помогает оставаться под лимитом, а повторные попытки становятся чище.
  • Маршрутизировать тяжелые агенты напрямую к провайдеру через переопределение модели для конкретного агента в agents.list[], вместо использования :cloud. Агенты с небольшим выводом оставьте на Ollama Cloud. Одноразовая настройка:
    openclaw onboard --auth-choice deepseek-api-key
    Затем в agents.list переопределите нуждающихся:
    "list": [ { "id": "your-agent", "model": "deepseek/deepseek-v4-pro" } ]
    Компромисс: оплата за токен вместо фиксированной платы, но применяется только к агентам, которым нужно больше пространства.

Вывод

Если ваши агенты сбоят на середине длинных выводов, и вы проверили очевидные вещи, обратите внимание на фактический лимит вывода вашего провайдера, прежде чем углубляться в кроличью нору поиска багов OpenClaw. Сообщение об ошибке бесполезно, а поле конфигурации не сообщает, что оно переопределяется сервером.

📖 Читать полный источник: r/openclaw

Ad

👀 Смотрите также

Автоматизация перезапуска сессий Claude с помощью tmux и at
Советы

Автоматизация перезапуска сессий Claude с помощью tmux и at

Используйте tmux и команду at, чтобы запланировать автоматический перезапуск сеанса Claude, когда использование сбрасывается в нерабочее время.

OpenClawRadar
Telegram vs Discord vs WhatsApp: выбор канала для OpenClaw
Советы

Telegram vs Discord vs WhatsApp: выбор канала для OpenClaw

r/openclaw community
Большинство людей используют Claude лишь на 5% его возможностей – вот как это исправить
Советы

Большинство людей используют Claude лишь на 5% его возможностей – вот как это исправить

После 60+ часов тестирования промптов на Claude Opus 4.7 пользователь делится 5-шаговым рецептом: назначить роль, задать контекст, установить ограничения, определить формат вывода, добавить принуждающую функцию.

OpenClawRadar
Пользователь Claude делится промтом «Не управляйте моими чувствами» для получения прямых технических отзывов
Советы

Пользователь Claude делится промтом «Не управляйте моими чувствами» для получения прямых технических отзывов

Пользователь Claude рекомендует установить определённый промпт в настройках пользователя, чтобы сократить вступительные фразы и получать более прямые технические отзывы. Промпт указывает Claude пропускать дипломатические формулировки и давать прямую критику технических и творческих работ.

OpenClawRadar