Correction maxTokens Ollama Cloud : la vraie limite est 16 384

Avis à tous ceux qui voient unexpected EOF d'agents en production : si votre openclaw.json contient des entrées de modèle cloud comme { "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }, ce maxTokens n'est pas réel. Ollama cloud limite la sortie à 16 384 jetons côté serveur, peu importe votre configuration. Lorsqu'un agent tente d'émettre quelque chose au-delà, le serveur amont coupe la socket en plein flux et vous obtenez une erreur de transport depuis ollama.com:443. OpenClaw traite cela comme un basculement lié à un délai d'attente, donc il tentera votre solution de repli si configurée — mais si le repli est aussi un modèle :cloud, même mur.

Ce qui a aidé

Corrigez maxTokens sur les entrées cloud pour qu'OpenClaw ne demande pas des budgets de sortie que le service n'honorera pas :
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k pas 16k — laisse un peu de marge car les modèles deviennent parfois étranges juste à la limite absolue.
Restructurez les sorties structurées volumineuses (long JSON, contenu multi-section) pour émettre une section par tour au lieu de tout regrouper. Reste en dessous de la limite et les tentatives sont plus propres.
Aiguillez les agents lourds vers un fournisseur direct via la surcharge de modèle par agent dans agents.list[] plutôt que de passer par :cloud. Laissez les agents à faible sortie sur Ollama cloud. Configuration unique :
openclaw onboard --auth-choice deepseek-api-key
Ensuite dans agents.list, surchargez ceux qui en ont besoin :
"list": [ { "id": "your-agent", "model": "deepseek/deepseek-v4-pro" } ]
Compromis : facturation par jeton au lieu d'un forfait, mais limité aux agents qui ont besoin de marge.

À retenir

Si vos agents échouent en cours de route sur des sorties longues et que vous avez vérifié les bases, examinez la limite de sortie réelle de votre fournisseur avant de vous lancer dans une chasse aux bogues OpenClaw. Le message d'erreur est inutile et le champ de configuration ne vous dit pas qu'il est écrasé côté serveur.

📖 Lire la source complète : r/openclaw

Correction de la limite maxTokens du modèle Ollama Cloud : le maximum est de 16K, pas la valeur de configuration

Ce qui a aidé

À retenir

👀 See Also

7 bugs de la passerelle MCP : fuites de session, SSE mort et OAuth en mode passerelle

Quatre fichiers locaux pour maintenir le contexte de Claude dans les projets longs

Routine de pré-codage avec Claude Code : 5 serveurs MCP avant d'écrire une ligne

Exécution de MiniMax M2.7 Q8_0 128K sur 2x3090 avec déchargement CPU – Benchmarks réels et configuration