Руководство: Развертывание OpenClaw с llama.cpp на мини-ПК GEEKOM IT15

Архитектура развертывания и ключевые изменения
В этом руководстве описывается развертывание, при котором шлюз OpenClaw (порт 18789) подключается к управляемому вручную llama-server (порт 8080) вместо стандартного сервера Ollama (порт 11434). Цель — запустить локальную модель Qwen3-8B с ускорением на GPU Intel Arc через SYCL.
Отладка и решения
Процесс включал устранение нескольких конфликтов конфигурации:
- Проблема 1: Неподдерживаемая конфигурация mcpServers: OpenClaw не поддерживает ключ конфигурации
mcpServers. Решение заключалось в удалении этого раздела изopenclaw.jsonи использовании пакетных файлов для ручного запускаllama-server, интегрируя его логику запуска в код Python. - Проблема 2: Конфликт кеша сессии: Кешированная сессия канала Feishu переопределяла новую глобальную конфигурацию, вызывая ошибки API Ollama. Это было исправлено удалением файла кеша сессии:
del "C:\Users\JiugeAItest\.openclaw\agents\main\sessions\sessions.json". - Проблема 3: Недостаточная длина контекста: Контекст
llama-serverпо умолчанию в 4096 токенов вызывал ошибки при длинных диалогах. Это было решено запуском сервера с параметром-c 32768и установкойcontextWindow: 32768в конфигурации OpenClaw.
Шаги развертывания
Настройка использует определенную структуру каталогов на GEEKOM IT15:
E:\Workspace_AI\Buildup_OpenClow ├── llama-b8245-bin-win-sycl-x64\ # версия llama.cpp с SYCL │ ├── llama-server.exe │ └── ... (DLL-файлы) ├── models\Qwen3-8B-GGUF\ │ └── Qwen3-8B-Q4_K_M.gguf # файл модели └── start_openclaw_with_llamacpp.bat # скрипт запуска
Примечание: Модель Qwen3-8B-Q4_K_M.gguf проверена на совместимость с версией llama.cpp b8245. Модели Qwen3.5 несовместимы с этой версией из-за несоответствия длины rope.dimension_sections.
Конфигурация OpenClaw
Основное изменение конфигурации находится в файле C:\Users\<Имя пользователя>\.openclaw\openclaw.json. Провайдер модели меняется с ollama на llama-cpp:
{
"agents": {
"defaults": {
"model": {
"primary": "llama-cpp/qwen3-8b"
}
}
},
"models": {
"providers": {
"ollama": { ... },
"llama-cpp": {
"api": "openai-completions",
"apiKey": "llama-cpp-local",
"baseUrl": "http://127.0.0.1:8080/v1",
"models": [
{
"contextWindow": 32768,
"id": "qwen3-8b",
"name": "qwen3-8b",
...
}
]
}
}
}
}Руководство также включает разделы со справочником параметров, руководством по избеганию типичных ошибок, устранением неполадок и инструкциями по возврату к Ollama при необходимости.
📖 Прочитать полный источник: r/openclaw
👀 Смотрите также

Структура рабочего пространства OpenClaw и подход к саморазвитию от давнего пользователя
Долгосрочный пользователь OpenClaw делится структурой своего рабочего пространства с ключевыми файлами разметки, такими как SOUL.md, AGENTS.md и MEMORY.md, а также важным уроком: разрешение агенту улучшать собственную среду значительно повышает эффективность.

Настройка OpenClaw для автоматизации работы браузера с участием человека, с использованием Docker, Chromium и noVNC
Разработчик делится своей настройкой контейнера Docker, которая позволяет OpenClaw обрабатывать CAPTCHA и подтверждения во время выполнения, используя Chromium с noVNC для удалённого доступа, требуя ~300 МБ ОЗУ и 3-секундный холодный старт.

Замена стандартной памяти OpenClaw на Redis и Qdrant для производственных мультиагентных систем
Разработчик заменил стандартную память SQLite в OpenClaw на Redis для временного состояния и Qdrant для постоянной векторной памяти, чтобы решить проблемы масштабирования в многозадачных агентных системах, реализовав семантический поиск, обмен данными между агентами и параллельную запись.

Восстановление удаленных разговоров Claude Desktop из кэша Chromium
Немедленно закройте Claude Desktop, найдите кеш Chromium blockfile в %APPDATA%\Claude\Cache\Cache_Data (Windows), затем используйте Python-пакеты ccl_chromium_reader и стандартные библиотеки сжатия для извлечения HTTP-ответов, содержащих UUID вашего чата.