Ollama CloudモデルのmaxTokens修正:上限は16K、設定値ではない

本番ターンでunexpected EOFが発生するエージェントがいる方へ:openclaw.jsonに{ "id": "deepseek-v4-pro:cloud", "maxTokens": 500000 }のようなクラウドモデルのエントリがある場合、そのmaxTokensは実際には機能しません。Ollamaクラウドは、設定にかかわらずサーバー側で出力を16,384トークンに制限します。エージェントがそれを超える出力を試みると、上流が途中でソケットを切断し、ollama.com:443からのトランスポートエラーが発生します。OpenClawはこれをタイムアウトとして扱いフォールバックを試みますが、フォールバックも:cloudモデルであれば同じ壁にぶつかります。
対策
- クラウドエントリのmaxTokensを修正して、OpenClawがサービスで利用できない出力予算を要求しないようにする:
{ "id": "deepseek-v4-pro:cloud", "maxTokens": 14000 }
{ "id": "kimi-k2.6:cloud", "maxTokens": 14000 }
14k(16kではありません)— 上限ぎりぎりでモデルが不安定になるのを避けるために余裕を持たせます。 - 大きな構造化出力(長いJSON、複数セクションのコンテンツ)を、一度にまとめて出力するのではなく、ターンごとに1セクションずつ出力するように再構成します。上限を下回り、リトライもスムーズになります。
- 負荷の大きいエージェントを直接プロバイダーにルーティングするには、
agents.list[]でエージェントごとにモデルを上書きし、:cloudを経由しないようにします。小出力のエージェントはOllamaクラウドに残します。一度の設定:
openclaw onboard --auth-choice deepseek-api-key
その後、agents.listで必要なエージェントを上書き:
"list": [ { "id": "your-agent", "model": "deepseek/deepseek-v4-pro" } ]
トレードオフ:定額ではなくトークン課金になりますが、余裕が必要なエージェントに限定できます。
まとめ
エージェントが長い出力の途中で失敗し、明らかな原因を確認したなら、OpenClawのバグを探す前に、プロバイダーの実際の出力上限を確認しましょう。エラーメッセージは役に立たず、設定フィールドもサーバー側で上書きされていることを教えてくれません。
📖 出典全文: r/openclaw
👀 See Also

Claude Codeにおけるトークン浪費:ユーザーの自己監査が示す、モデル切り替えより行動修正が有効
あるユーザーがClaude Codeのトークン使用量を測定したところ、タスク間の/clear、編集前の計画、編集済みファイルの再読み込み禁止が、モデルを切り替えるよりも多くのトークンを節約できることがわかった。実践的な規律がラッパーより優れている。

RedditユーザーによるClaude Code活用の10の実践的ヒント
RedditユーザーがClaude Codeの具体的なテクニックを共有しています。これには、拡張思考のために「ultrathink」と共に/effort highを使用すること、/forkによる独立した会話ブランチの作成、.claude/settings.jsonでのカスタムフックの設定などが含まれます。

OpenClawをローカルLLMの力で強化:GLM-4.7-Flashの導入
GLM-4.7-FlashとOpenClawの統合は、シームレスなローカルデプロイメントと高度なコード実行を可能にすることで、AIオートメーションに革命をもたらしています。

7件のMCPゲートウェイバグ:セッション漏洩、デッドSSE、およびゲートウェイモードのOAuth
あるRedditの投稿が、MCPゲートウェイの実世界での7つのバグを詳述している。セッション状態がクライアント間で漏れる、SSE切断が静かに発生する、ゲートウェイモードでOAuthが失敗するなど。修正は、より良いプロンプトではなく、堅実なインフラに基づいている。