Ollama Cloud maxTokensの真実：実質上限は16,384

本番ターンでunexpected EOFが発生するエージェントがいる方へ：openclaw.jsonに{ "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }のようなクラウドモデルのエントリがある場合、そのmaxTokensは実際には機能しません。Ollamaクラウドは、設定にかかわらずサーバー側で出力を16,384トークンに制限します。エージェントがそれを超える出力を試みると、上流が途中でソケットを切断し、ollama.com:443からのトランスポートエラーが発生します。OpenClawはこれをタイムアウトとして扱いフォールバックを試みますが、フォールバックも:cloudモデルであれば同じ壁にぶつかります。

対策

クラウドエントリのmaxTokensを修正して、OpenClawがサービスで利用できない出力予算を要求しないようにする：
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k（16kではありません）— 上限ぎりぎりでモデルが不安定になるのを避けるために余裕を持たせます。
大きな構造化出力（長いJSON、複数セクションのコンテンツ）を、一度にまとめて出力するのではなく、ターンごとに1セクションずつ出力するように再構成します。上限を下回り、リトライもスムーズになります。
負荷の大きいエージェントを直接プロバイダーにルーティングするには、agents.list[]でエージェントごとにモデルを上書きし、:cloudを経由しないようにします。小出力のエージェントはOllamaクラウドに残します。一度の設定：
openclaw onboard --auth-choice deepseek-api-key
その後、agents.listで必要なエージェントを上書き：
"list": [ { "id": "your-agent", "model": "deepseek/deepseek-v4-pro" } ]
トレードオフ：定額ではなくトークン課金になりますが、余裕が必要なエージェントに限定できます。