ガイド:GEEKOM IT15 ミニPCで llama.cpp を使用して OpenClaw をデプロイする

✍️ OpenClawRadar📅 公開日: March 27, 2026🔗 Source
ガイド:GEEKOM IT15 ミニPCで llama.cpp を使用して OpenClaw をデプロイする
Ad

デプロイメントアーキテクチャと主な変更点

このガイドでは、OpenClawのゲートウェイ(ポート18789)がデフォルトのOllamaサーバー(ポート11434)ではなく、手動で管理するllama-server(ポート8080)に接続するデプロイメントについて説明します。目的は、SYCLを介したIntel Arc GPUアクセラレーションを使用してローカルのQwen3-8Bモデルを実行することです。

デバッグと解決策

このプロセスでは、いくつかの設定の競合を解決する必要がありました:

  • 問題1: サポートされていないmcpServers設定: OpenClawはmcpServers設定キーをサポートしていません。解決策は、openclaw.jsonからこのセクションを削除し、バッチファイルを使用してllama-serverを手動で起動し、その起動ロジックをPythonコードに統合することでした。
  • 問題2: セッションキャッシュの競合: キャッシュされたFeishuチャネルセッションが新しいグローバル設定を上書きし、Ollama APIエラーを引き起こしていました。これは、セッションキャッシュファイルを削除することで修正されました:del "C:\Users\JiugeAItest\.openclaw\agents\main\sessions\sessions.json"
  • 問題3: コンテキスト長の不足: デフォルトのllama-serverのコンテキスト長4096トークンでは、長い会話でエラーが発生しました。これは、サーバーを-c 32768で起動し、OpenClaw設定でcontextWindow: 32768を設定することで解決されました。

デプロイメント手順

このセットアップでは、GEEKOM IT15上の特定のディレクトリ構造を使用しています:

E:\Workspace_AI\Buildup_OpenClow
├── llama-b8245-bin-win-sycl-x64\ # llama.cpp SYCLバージョン
│   ├── llama-server.exe
│   └── ... (DLLs)
├── models\Qwen3-8B-GGUF\
│   └── Qwen3-8B-Q4_K_M.gguf # モデルファイル
└── start_openclaw_with_llamacpp.bat # 起動スクリプト

注意: Qwen3-8B-Q4_K_M.ggufモデルは、llama.cppバージョンb8245と互換性があることが確認されています。Qwen3.5モデルは、rope.dimension_sectionsの長さの不一致により、このバージョンと互換性がありません。

Ad

OpenClaw設定

主な設定変更はC:\Users\<ユーザー名>\.openclaw\openclaw.jsonにあります。モデルプロバイダーはollamaからllama-cppに切り替えられています:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "llama-cpp/qwen3-8b"
      }
    }
  },
  "models": {
    "providers": {
      "ollama": { ... },
      "llama-cpp": {
        "api": "openai-completions",
        "apiKey": "llama-cpp-local",
        "baseUrl": "http://127.0.0.1:8080/v1",
        "models": [
          {
            "contextWindow": 32768,
            "id": "qwen3-8b",
            "name": "qwen3-8b",
            ...
          }
        ]
      }
    }
  }
}

このガイドには、パラメータリファレンス、落とし穴回避ガイド、トラブルシューティング、必要に応じてOllamaに戻すための手順などのセクションも含まれています。

📖 完全なソースを読む: r/openclaw

Ad

👀 See Also

OpenClawのプロンプト肥大化と応答ループの遅延を修正
Guides

OpenClawのプロンプト肥大化と応答ループの遅延を修正

2026.4.26以降、長い遅延が発生しているユーザーは、コンテキストの肥大化を減らすことでパフォーマンスを取り戻せます。常に注入されるファイルをトリミングし、表示スキルを制限し、メインチャットに大量のツール出力を貼り付けないようにしましょう。

OpenClawRadar
Claude CodeのKVキャッシュ無効化をローカルバックエンドで修正
Guides

Claude CodeのKVキャッシュ無効化をローカルバックエンドで修正

Claude Codeバージョン2.1.36以降は、すべてのリクエストに動的なテレメトリヘッダーとgitステータス更新を注入し、プレフィックスマッチングを破壊し、llama.cppのようなローカルバックエンドで20K以上のトークンのシステムプロンプト全体の再処理を強制します。~/.claude/settings.jsonの設定修正により、処理時間を60秒以上から約4秒に短縮できます。

OpenClawRadar
Claude Code LSP セットアップガイド:構造的コード理解
Guides

Claude Code LSP セットアップガイド:構造的コード理解

Redditの投稿では、Claude Codeをテキストマッチングではなく構造的なコード理解のためにLanguage Server Protocolを使用するように設定する方法が詳しく説明されています。これにより、定義へのジャンプ、参照の検索、呼び出し階層などの機能でクエリ時間が30〜60秒から約50msに短縮されるとのことです。

OpenClawRadar
iOSショートカットを使ったiCloud同期経由でのiPhone写真をCoworkに送る回避策
Guides

iOSショートカットを使ったiCloud同期経由でのiPhone写真をCoworkに送る回避策

ある開発者が「PhoPo」というiOSショートカットを作成しました。これはiPhoneの写真をJPEGに変換し、サイズを変更して、CoworkがアクセスできるiCloud同期フォルダに保存するもので、モバイルデバイスからのスクリーンショットや写真をClaudeが分析できるようにします。

OpenClawRadar