ガイド:GEEKOM IT15 ミニPCで llama.cpp を使用して OpenClaw をデプロイする

デプロイメントアーキテクチャと主な変更点
このガイドでは、OpenClawのゲートウェイ(ポート18789)がデフォルトのOllamaサーバー(ポート11434)ではなく、手動で管理するllama-server(ポート8080)に接続するデプロイメントについて説明します。目的は、SYCLを介したIntel Arc GPUアクセラレーションを使用してローカルのQwen3-8Bモデルを実行することです。
デバッグと解決策
このプロセスでは、いくつかの設定の競合を解決する必要がありました:
- 問題1: サポートされていないmcpServers設定: OpenClawは
mcpServers設定キーをサポートしていません。解決策は、openclaw.jsonからこのセクションを削除し、バッチファイルを使用してllama-serverを手動で起動し、その起動ロジックをPythonコードに統合することでした。 - 問題2: セッションキャッシュの競合: キャッシュされたFeishuチャネルセッションが新しいグローバル設定を上書きし、Ollama APIエラーを引き起こしていました。これは、セッションキャッシュファイルを削除することで修正されました:
del "C:\Users\JiugeAItest\.openclaw\agents\main\sessions\sessions.json"。 - 問題3: コンテキスト長の不足: デフォルトの
llama-serverのコンテキスト長4096トークンでは、長い会話でエラーが発生しました。これは、サーバーを-c 32768で起動し、OpenClaw設定でcontextWindow: 32768を設定することで解決されました。
デプロイメント手順
このセットアップでは、GEEKOM IT15上の特定のディレクトリ構造を使用しています:
E:\Workspace_AI\Buildup_OpenClow ├── llama-b8245-bin-win-sycl-x64\ # llama.cpp SYCLバージョン │ ├── llama-server.exe │ └── ... (DLLs) ├── models\Qwen3-8B-GGUF\ │ └── Qwen3-8B-Q4_K_M.gguf # モデルファイル └── start_openclaw_with_llamacpp.bat # 起動スクリプト
注意: Qwen3-8B-Q4_K_M.ggufモデルは、llama.cppバージョンb8245と互換性があることが確認されています。Qwen3.5モデルは、rope.dimension_sectionsの長さの不一致により、このバージョンと互換性がありません。
OpenClaw設定
主な設定変更はC:\Users\<ユーザー名>\.openclaw\openclaw.jsonにあります。モデルプロバイダーはollamaからllama-cppに切り替えられています:
{
"agents": {
"defaults": {
"model": {
"primary": "llama-cpp/qwen3-8b"
}
}
},
"models": {
"providers": {
"ollama": { ... },
"llama-cpp": {
"api": "openai-completions",
"apiKey": "llama-cpp-local",
"baseUrl": "http://127.0.0.1:8080/v1",
"models": [
{
"contextWindow": 32768,
"id": "qwen3-8b",
"name": "qwen3-8b",
...
}
]
}
}
}
}このガイドには、パラメータリファレンス、落とし穴回避ガイド、トラブルシューティング、必要に応じてOllamaに戻すための手順などのセクションも含まれています。
📖 完全なソースを読む: r/openclaw
👀 See Also

OpenClawのプロンプト肥大化と応答ループの遅延を修正
2026.4.26以降、長い遅延が発生しているユーザーは、コンテキストの肥大化を減らすことでパフォーマンスを取り戻せます。常に注入されるファイルをトリミングし、表示スキルを制限し、メインチャットに大量のツール出力を貼り付けないようにしましょう。

Claude CodeのKVキャッシュ無効化をローカルバックエンドで修正
Claude Codeバージョン2.1.36以降は、すべてのリクエストに動的なテレメトリヘッダーとgitステータス更新を注入し、プレフィックスマッチングを破壊し、llama.cppのようなローカルバックエンドで20K以上のトークンのシステムプロンプト全体の再処理を強制します。~/.claude/settings.jsonの設定修正により、処理時間を60秒以上から約4秒に短縮できます。

Claude Code LSP セットアップガイド:構造的コード理解
Redditの投稿では、Claude Codeをテキストマッチングではなく構造的なコード理解のためにLanguage Server Protocolを使用するように設定する方法が詳しく説明されています。これにより、定義へのジャンプ、参照の検索、呼び出し階層などの機能でクエリ時間が30〜60秒から約50msに短縮されるとのことです。

iOSショートカットを使ったiCloud同期経由でのiPhone写真をCoworkに送る回避策
ある開発者が「PhoPo」というiOSショートカットを作成しました。これはiPhoneの写真をJPEGに変換し、サイズを変更して、CoworkがアクセスできるiCloud同期フォルダに保存するもので、モバイルデバイスからのスクリーンショットや写真をClaudeが分析できるようにします。