Corregir maxTokens del modelo Ollama Cloud: Límite es 16K, no el valor configurado

✍️ OpenClawRadar📅 Publicado: 3 de junio de 2026🔗 Source
Corregir maxTokens del modelo Ollama Cloud: Límite es 16K, no el valor configurado
Ad

AVISO para quienes vean unexpected EOF de agentes en producción: si tu openclaw.json tiene entradas de modelo cloud como { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, ese maxTokens no es real. Ollama cloud limita la salida a 16,384 tokens del lado del servidor sin importar tu configuración. Cuando un agente intenta emitir algo más allá de eso, el upstream cierra el socket a medio camino y ves un error de transporte de ollama.com:443. OpenClaw lo trata como un failover con forma de timeout, por lo que intentará tu respaldo si está configurado, pero si el respaldo también es un modelo :cloud, mismo muro.

Ad

Lo que ayudó

  • Corregir maxTokens en entradas cloud para que OpenClaw no solicite presupuestos de salida que el servicio no honrará:
    { "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
    { "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
    14k no 16k: deja un pequeño margen porque los modelos a veces se comportan raro justo en el límite absoluto.
  • Reestructurar salidas grandes (JSON largo, contenido de múltiples secciones) para emitir una sección por turno en lugar de agrupar todo. Se mantiene por debajo del límite y los reintentos son más limpios.
  • Redirigir agentes pesados a un proveedor directo mediante la anulación de modelo por agente en agents.list[] en lugar de pasar por :cloud. Deja los agentes de salida pequeña en Ollama cloud. Configuración única:
    openclaw onboard --auth-choice deepseek-api-key
    Luego en agents.list anula los que lo necesiten:
    "list": [ { "id": "tu-agente", "model": "deepseek/deepseek-v4-pro" } ]
    Compensación: facturación por token en lugar de tarifa plana, pero limitado a agentes que necesitan margen.

Conclusión

Si tus agentes fallan a mitad de salidas largas y ya revisaste lo obvio, mira el límite de salida real de tu proveedor antes de meterte en el agujero de conejo de errores de OpenClaw. El mensaje de error es inútil y el campo de configuración no te dice que está siendo anulado del lado del servidor.

📖 Lee la fuente completa: r/openclaw

Ad

👀 Ver también

Estrategias Prácticas para Evitar los Límites de Tasa de Claude en el Plan Máximo de $200
Consejos

Estrategias Prácticas para Evitar los Límites de Tasa de Claude en el Plan Máximo de $200

Un desarrollador comparte técnicas específicas que han evitado la limitación de velocidad en el plan máximo de $200 de Claude durante más de un mes, incluyendo consultas a bases de datos SQLite, sistemas de transferencia de contexto y despliegue estratégico de hardware.

OpenClawRadar
Los Agentes Trabajadores No Deberían Escribir Memoria Directamente: Un Patrón Curador-Agente
Consejos

Los Agentes Trabajadores No Deberían Escribir Memoria Directamente: Un Patrón Curador-Agente

Un post de Reddit detalla un patrón de Curador de Memoria que evita que los agentes trabajadores escriban directamente en la memoria compartida, enrutando eventos a través de una capa de validación y alcance.

OpenClawRadar
11 consejos profundos de Claude de un usuario diario de 18 meses
Consejos

11 consejos profundos de Claude de un usuario diario de 18 meses

Un desarrollador senior comparte 11 consejos no obvios sobre Claude tras 18 meses de uso diario, incluyendo Projects, Custom Styles, Memory, Sonnet 4.6 vs Opus 4.7, Haiku 4.5 para trabajo por lotes, subagentes de Claude Code y Artifacts llamando a la API.

OpenClawRadar
Enrutamiento de modelos reduce costos de API en 85% frente a suscripción Claude Max – Análisis de un desarrollador
Consejos

Enrutamiento de modelos reduce costos de API en 85% frente a suscripción Claude Max – Análisis de un desarrollador

Un suscriptor de Claude Max rastreó el uso de tokens y encontró que solo el 15% de las tareas necesitaban Opus. Cambiar al enrutamiento de API (Sonnet para tareas rutinarias, Opus para razonamiento complejo) redujo el costo mensual de $200 a ~$30 con una calidad de salida idéntica.

OpenClawRadar