Soluciona maxTokens en Ollama Cloud: límite real es 16,384

AVISO para quienes vean unexpected EOF de agentes en producción: si tu openclaw.json tiene entradas de modelo cloud como { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, ese maxTokens no es real. Ollama cloud limita la salida a 16,384 tokens del lado del servidor sin importar tu configuración. Cuando un agente intenta emitir algo más allá de eso, el upstream cierra el socket a medio camino y ves un error de transporte de ollama.com:443. OpenClaw lo trata como un failover con forma de timeout, por lo que intentará tu respaldo si está configurado, pero si el respaldo también es un modelo :cloud, mismo muro.

Lo que ayudó

Corregir maxTokens en entradas cloud para que OpenClaw no solicite presupuestos de salida que el servicio no honrará:
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k no 16k: deja un pequeño margen porque los modelos a veces se comportan raro justo en el límite absoluto.
Reestructurar salidas grandes (JSON largo, contenido de múltiples secciones) para emitir una sección por turno en lugar de agrupar todo. Se mantiene por debajo del límite y los reintentos son más limpios.
Redirigir agentes pesados a un proveedor directo mediante la anulación de modelo por agente en agents.list[] en lugar de pasar por :cloud. Deja los agentes de salida pequeña en Ollama cloud. Configuración única:
openclaw onboard --auth-choice deepseek-api-key
Luego en agents.list anula los que lo necesiten:
"list": [ { "id": "tu-agente", "model": "deepseek/deepseek-v4-pro" } ]
Compensación: facturación por token en lugar de tarifa plana, pero limitado a agentes que necesitan margen.

Conclusión

Si tus agentes fallan a mitad de salidas largas y ya revisaste lo obvio, mira el límite de salida real de tu proveedor antes de meterte en el agujero de conejo de errores de OpenClaw. El mensaje de error es inútil y el campo de configuración no te dice que está siendo anulado del lado del servidor.

📖 Lee la fuente completa: r/openclaw

Corregir maxTokens del modelo Ollama Cloud: Límite es 16K, no el valor configurado

Lo que ayudó

Conclusión

👀 Ver también

¿El panel de OpenClaw se desconecta tras la actualización 2026.5.27? Solución: eliminar el trabajo launchd atascado en la actualización

Reduzca los tokens de OpenClaw Boot en un 43% al reducir el tamaño de la herramienta y los archivos de memoria

Claude no es malo programando — tu configuración de contexto es el problema

Enmarcar Conversaciones de IA en Lugar de Escribir Prompts Perfectos