Corrigir Ollama Cloud Model maxTokens: Limite é 16K, não valor configuração

✍️ OpenClawRadar📅 Publicado: June 3, 2026🔗 Source
Corrigir Ollama Cloud Model maxTokens: Limite é 16K, não valor configuração
Ad

PSA para quem está vendo EOF inesperado de agentes em produção: se seu openclaw.json tem entradas de modelo cloud como { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, esse maxTokens não é real. O Ollama cloud limita a saída em 16.384 tokens no lado do servidor, independentemente da sua configuração. Quando um agente tenta emitir algo além disso, o upstream encerra o socket no meio da stream e você vê um erro de transporte de ollama.com:443. O OpenClaw trata isso como um failover com formato de timeout, então tentará seu fallback se configurado — mas se o fallback também for um modelo :cloud, mesma barreira.

Ad

O Que Ajudou

  • Corrigir maxTokens em entradas cloud para que o OpenClaw não peça orçamentos de saída que o serviço não honrará:
    { "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
    { "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
    14k, não 16k — deixa uma pequena margem porque os modelos às vezes ficam estranhos bem no limite absoluto.
  • Reestruturar saídas estruturadas grandes (JSON longo, conteúdo de múltiplas seções) para emitir uma seção por vez, em vez de agrupar tudo. Fica abaixo do limite e as tentativas são mais limpas.
  • Direcionar agentes pesados para um provedor direto via substituição de modelo por agente em agents.list[] em vez de usar :cloud. Deixe agentes de saída pequena no Ollama cloud. Configuração única:
    openclaw onboard --auth-choice deepseek-api-key
    Depois, em agents.list, substitua os que precisam:
    "list": [ { "id": "seu-agente", "model": "deepseek/deepseek-v4-pro" } ]
    Compensação: cobrança por token em vez de taxa fixa, mas limitada aos agentes que precisam de espaço.

Conclusão

Se seus agentes falham no meio de saídas longas e você já verificou o óbvio, verifique o limite real de saída do seu provedor antes de cair na toca do coelho de bugs do OpenClaw. A mensagem de erro é inútil e o campo de configuração não informa que está sendo substituído no lado do servidor.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Opus sobre falhas de agentes de IA: Desculpas não são correções, arquitetura é
Tips

Opus sobre falhas de agentes de IA: Desculpas não são correções, arquitetura é

Um usuário do Reddit compartilha como Claude Opus reformulou sua compreensão sobre falhas de agentes de IA: confiar em pedidos de desculpas leva a erros repetidos; apenas barreiras estruturais no código, validação ou limites de execução corrigem o modo de falha.

OpenClawRadar
Agentes de Auditoria em Paralelo: Uma Abordagem Prática para Testes Codificados por Vibração com Claude
Tips

Agentes de Auditoria em Paralelo: Uma Abordagem Prática para Testes Codificados por Vibração com Claude

Um desenvolvedor construiu um sistema de teste de usuários com Claude usando 10 agentes de auditoria paralelos cobrindo detecção de alucinação, sentinela de API, teste de estresse de UI, anonimização de PII, SEO, conformidade legal, simulação comportamental, personas demográficas, teste de funil e verificação de fatos.

OpenClawRadar
Automação Econômica do OpenClaw: Usando LLMs Apenas Quando Necessário
Tips

Automação Econômica do OpenClaw: Usando LLMs Apenas Quando Necessário

Um desenvolvedor compartilha uma abordagem prática para usar o OpenClaw em tarefas determinísticas sem chamadas constantes a LLM, criando scripts Python para cron jobs e invocando o LLM apenas quando erros exigem análise e correções.

OpenClawRadar
Correção de Desperdício de Tokens no Claude Code: Desativar Cabeçalho de Atribuição para Melhores Acertos de Cache
Tips

Correção de Desperdício de Tokens no Claude Code: Desativar Cabeçalho de Atribuição para Melhores Acertos de Cache

Definir CLAUDE_CODE_ATTRIBUTION_HEADER=false na configuração do seu shell pode melhorar a taxa de acertos do cache de prompts entre sessões do Claude Code de 48% para 99,98%, reduzindo os custos de processamento do prompt do sistema em 7x por sessão.

OpenClawRadar