Ollama Cloud maxTokens: Capacidade real é 16.384

PSA para quem está vendo EOF inesperado de agentes em produção: se seu openclaw.json tem entradas de modelo cloud como { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, esse maxTokens não é real. O Ollama cloud limita a saída em 16.384 tokens no lado do servidor, independentemente da sua configuração. Quando um agente tenta emitir algo além disso, o upstream encerra o socket no meio da stream e você vê um erro de transporte de ollama.com:443. O OpenClaw trata isso como um failover com formato de timeout, então tentará seu fallback se configurado — mas se o fallback também for um modelo :cloud, mesma barreira.

O Que Ajudou

Corrigir maxTokens em entradas cloud para que o OpenClaw não peça orçamentos de saída que o serviço não honrará:
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k, não 16k — deixa uma pequena margem porque os modelos às vezes ficam estranhos bem no limite absoluto.
Reestruturar saídas estruturadas grandes (JSON longo, conteúdo de múltiplas seções) para emitir uma seção por vez, em vez de agrupar tudo. Fica abaixo do limite e as tentativas são mais limpas.
Direcionar agentes pesados para um provedor direto via substituição de modelo por agente em agents.list[] em vez de usar :cloud. Deixe agentes de saída pequena no Ollama cloud. Configuração única:
openclaw onboard --auth-choice deepseek-api-key
Depois, em agents.list, substitua os que precisam:
"list": [ { "id": "seu-agente", "model": "deepseek/deepseek-v4-pro" } ]
Compensação: cobrança por token em vez de taxa fixa, mas limitada aos agentes que precisam de espaço.

Conclusão

Se seus agentes falham no meio de saídas longas e você já verificou o óbvio, verifique o limite real de saída do seu provedor antes de cair na toca do coelho de bugs do OpenClaw. A mensagem de erro é inútil e o campo de configuração não informa que está sendo substituído no lado do servidor.

📖 Leia a fonte completa: r/openclaw

Corrigir Ollama Cloud Model maxTokens: Limite é 16K, não valor configuração

O Que Ajudou

Conclusão

👀 See Also

Diagnosticando o Desempenho Degradado do Claude: Causas Raiz e Soluções

QA e Testes Automatizados com IA: Uma Nova Era para Testes de Software

Correção de Desperdício de Tokens no Claude Code: Desativar Cabeçalho de Atribuição para Melhores Acertos de Cache

Como Parar de Atingir os Limites do Claude: Trate Cada Sessão como um Orçamento de Tokens