Руководство: Развертывание OpenClaw с llama.cpp на мини-ПК GEEKOM IT15

✍️ OpenClawRadar📅 Опубликовано: 27 марта 2026 г.🔗 Source

Архитектура развертывания и ключевые изменения

В этом руководстве описывается развертывание, при котором шлюз OpenClaw (порт 18789) подключается к управляемому вручную llama-server (порт 8080) вместо стандартного сервера Ollama (порт 11434). Цель — запустить локальную модель Qwen3-8B с ускорением на GPU Intel Arc через SYCL.

Отладка и решения

Процесс включал устранение нескольких конфликтов конфигурации:

Проблема 1: Неподдерживаемая конфигурация mcpServers: OpenClaw не поддерживает ключ конфигурации mcpServers. Решение заключалось в удалении этого раздела из openclaw.json и использовании пакетных файлов для ручного запуска llama-server, интегрируя его логику запуска в код Python.
Проблема 2: Конфликт кеша сессии: Кешированная сессия канала Feishu переопределяла новую глобальную конфигурацию, вызывая ошибки API Ollama. Это было исправлено удалением файла кеша сессии: del "C:\Users\JiugeAItest\.openclaw\agents\main\sessions\sessions.json".
Проблема 3: Недостаточная длина контекста: Контекст llama-server по умолчанию в 4096 токенов вызывал ошибки при длинных диалогах. Это было решено запуском сервера с параметром -c 32768 и установкой contextWindow: 32768 в конфигурации OpenClaw.

Шаги развертывания

Настройка использует определенную структуру каталогов на GEEKOM IT15:

E:\Workspace_AI\Buildup_OpenClow
├── llama-b8245-bin-win-sycl-x64\ # версия llama.cpp с SYCL
│   ├── llama-server.exe
│   └── ... (DLL-файлы)
├── models\Qwen3-8B-GGUF\
│   └── Qwen3-8B-Q4_K_M.gguf # файл модели
└── start_openclaw_with_llamacpp.bat # скрипт запуска

Примечание: Модель Qwen3-8B-Q4_K_M.gguf проверена на совместимость с версией llama.cpp b8245. Модели Qwen3.5 несовместимы с этой версией из-за несоответствия длины rope.dimension_sections.

Конфигурация OpenClaw

Основное изменение конфигурации находится в файле C:\Users\<Имя пользователя>\.openclaw\openclaw.json. Провайдер модели меняется с ollama на llama-cpp:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "llama-cpp/qwen3-8b"
      }
    }
  },
  "models": {
    "providers": {
      "ollama": { ... },
      "llama-cpp": {
        "api": "openai-completions",
        "apiKey": "llama-cpp-local",
        "baseUrl": "http://127.0.0.1:8080/v1",
        "models": [
          {
            "contextWindow": 32768,
            "id": "qwen3-8b",
            "name": "qwen3-8b",
            ...
          }
        ]
      }
    }
  }
}

Руководство также включает разделы со справочником параметров, руководством по избеганию типичных ошибок, устранением неполадок и инструкциями по возврату к Ollama при необходимости.

📖 Прочитать полный источник: r/openclaw

👀 Смотрите также

Гайды

Структурированный рабочий процесс ИИ с поэтапными командами для сокращения переделок

Разработчик делится программируемым рабочим процессом с использованием конкретных команд, таких как /pwf-brainstorm и /pwf-work-plan, для решения распространённых проблем при работе с ИИ в программировании: потеря контекста, нарушение стандартов и смешение планирования с выполнением. Подход включает обязательное обновление документации и многоуровневую структуру проекта.

21 мар. 2026 г., 15:45 UTC

OpenClawRadar

Гайды

Исправление ошибки расширения Claude для VS Code: 'command claude-vscode.editor.openLast not found'

Версия 2.1.51 расширения Claude для VS Code содержит критическую ошибку, вызывающую сообщение об ошибке 'command claude-vscode.editor.openLast not found'. Временное решение — откатиться до версии 2.1.49.

24 февр. 2026 г., 09:45 UTC

OpenClawRadar

Гайды

Сообщество OpenClaw: Поделитесь своей настройкой для программирования с ИИ и ежемесячными расходами

Тред на Reddit в сообществе r/openclaw собирает практические настройки для AI-агентов программирования, фокусируясь на стратегиях маршрутизации моделей, правилах экономии средств и сопоставлениях оборудования с моделями от сообщества с указанием ежемесячных диапазонов затрат.

2 мар. 2026 г., 01:45 UTC

OpenClawRadar

Гайды

Клод: Навыки кодирования vs. Пользовательские агенты: Ментальная модель, основанная на постоянстве задач

Пользователь Reddit объясняет разницу между навыками Claude Code и пользовательскими агентами: навыки выполняют одни и те же шаги каждый раз, в то время как пользовательские агенты требуют рассуждений и адаптации. В посте также рассматриваются параллельные подчинённые агенты, делегирование, хуки и строительные блоки.

24 мар. 2026 г., 00:45 UTC

OpenClawRadar