OpenClaw 4.1 + Gemma 4 Stack：ハイブリッドアーキテクチャと修正点

ハイブリッドエージェントアーキテクチャ

推奨されるセットアップはハイブリッドアプローチを採用しています：メインのオーケストレーター（「メインブレイン」）としてClaudeやMinaiaxのような重量級APIを使用し、コーディング、反復タスク、データ処理をOllama経由でGemma 4を実行するローカルサブエージェントに委任します。Gemma 4 26B Mixture of Experts（MoE）モデルは、現在の最適な選択肢として強調されており、推論時に約38億パラメータのみを活性化しながら、構造化されたJSON出力、関数呼び出し、多段階計画をサポートします。

Turbo Quantとハードウェア

Googleの「Turbo Quant」イノベーションにより、モデルは8倍小さく、6倍高速になります。26Bモデルは約16.9 GBのメモリを使用すると報告されており、ベースモデルのMac MiniやWi-Fiネットワーク上の複数のマシンで実行可能です。この投稿では、Atomic BotがTurbo Quant最適化されたローカルモデルを取得し、ワンクリックでOpenClawに接続できるツールとして言及されています。

重要な設定修正

ソースは、ローカルモデルのツール呼び出しにおける一般的なエラーを特定しています：OpenClawでOllamaを設定する際にOpenAI互換URL（/v1）を使用することです。修正方法は、OpenClawをプレーンなOllamaベースURL：http://127.0.0.1:11434にポイントすることです。これにより、OpenClawのネイティブOllama APIサポートを活用して、より優れたストリーミングと信頼性の高いツール呼び出しが可能になります。

コンテキストウィンドウ管理

エージェントワークフローでは、大きなコンテキストウィンドウを確保することが重要です。この投稿では、コンテキストフラグを付けてOllamaを起動することを推奨しています：Ollama run [model] --context-length=32768。あるいは、ネイティブで最大256Kのコンテキストウィンドウを持つ特定の18GBまたは20GBのGemma 4バージョンが、OpenClawのメモリシステムにとって重要であると指摘されています。

既知のバグと回避策

OpenClaw 4.1には、ダッシュボードでローカルのOllamaモデルからクラウドAPI（OpenRouterなど）に切り替える際に障害が発生し、「ハートビート」応答が返されるUIバグがあります。回避策は、オンボーディングメニューで元のモデルに戻すか、Claudeにゲートウェイを修正するよう依頼することです。

📖 Read the full source: r/openclaw