OpenClaw mit llama.cpp auf GEEKOM IT15 bereitstellen

Bereitstellungsarchitektur und wesentliche Änderungen

Diese Anleitung beschreibt eine Bereitstellung, bei der das Gateway von OpenClaw (Port 18789) mit einem manuell verwalteten llama-server (Port 8080) verbunden wird, anstatt mit dem standardmäßigen Ollama-Server (Port 11434). Das Ziel ist es, ein lokales Qwen3-8B-Modell mithilfe von Intel Arc GPU-Beschleunigung über SYCL auszuführen.

Fehlersuche und Lösungen

Der Prozess umfasste die Lösung mehrerer Konfigurationskonflikte:

Problem 1: Nicht unterstützte mcpServers-Konfiguration: OpenClaw unterstützt den Konfigurationsschlüssel mcpServers nicht. Die Lösung bestand darin, diesen Abschnitt aus openclaw.json zu entfernen und Batch-Dateien zu verwenden, um llama-server manuell zu starten und dessen Startlogik in Python-Code zu integrieren.
Problem 2: Sitzungscache-Konflikt: Ein zwischengespeicherter Feishu-Kanal-Sitzung überschrieb die neue globale Konfiguration und verursachte Ollama-API-Fehler. Dies wurde behoben, indem die Sitzungscache-Datei gelöscht wurde: del "C:\Users\JiugeAItest\.openclaw\agents\main\sessions\sessions.json".
Problem 3: Unzureichende Kontextlänge: Der Standardkontext von llama-server mit 4096 Token verursachte Fehler bei längeren Gesprächen. Dies wurde gelöst, indem der Server mit -c 32768 gestartet und contextWindow: 32768 in der OpenClaw-Konfiguration gesetzt wurde.

Bereitstellungsschritte

Das Setup verwendet eine spezifische Verzeichnisstruktur auf dem GEEKOM IT15:

E:\Workspace_AI\Buildup_OpenClow
├── llama-b8245-bin-win-sycl-x64\ # llama.cpp SYCL-Version
│   ├── llama-server.exe
│   └── ... (DLLs)
├── models\Qwen3-8B-GGUF\
│   └── Qwen3-8B-Q4_K_M.gguf # Modelldatei
└── start_openclaw_with_llamacpp.bat # Startskript

Hinweis: Das Qwen3-8B-Q4_K_M.gguf-Modell ist mit der llama.cpp-Version b8245 kompatibel. Qwen3.5-Modelle sind mit dieser Version aufgrund einer Längenabweichung bei rope.dimension_sections nicht kompatibel.

OpenClaw-Konfiguration

Die primäre Konfigurationsänderung befindet sich in C:\Users\<Benutzername>\.openclaw\openclaw.json. Der Modellanbieter wird von ollama auf llama-cpp umgestellt:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "llama-cpp/qwen3-8b"
      }
    }
  },
  "models": {
    "providers": {
      "ollama": { ... },
      "llama-cpp": {
        "api": "openai-completions",
        "apiKey": "llama-cpp-local",
        "baseUrl": "http://127.0.0.1:8080/v1",
        "models": [
          {
            "contextWindow": 32768,
            "id": "qwen3-8b",
            "name": "qwen3-8b",
            ...
          }
        ]
      }
    }
  }
}

Die Anleitung enthält auch Abschnitte zu Parameterreferenzen, einem Leitfaden zur Vermeidung von Fallstricken, Fehlerbehebung und Anweisungen für den Wechsel zurück zu Ollama, falls erforderlich.

📖 Quelle vollständig lesen: r/openclaw

Anleitung: Bereitstellung von OpenClaw mit llama.cpp auf dem GEEKOM IT15 Mini-PC

Bereitstellungsarchitektur und wesentliche Änderungen

Fehlersuche und Lösungen

Bereitstellungsschritte

OpenClaw-Konfiguration

👀 Siehe auch

CLAUDE.md Verfassung: Aufbau eines persönlichen KI-Agenten – Teil II Dateidurchlauf

OpenClaw-Integration mit WhatsApp Cloud API

Opus 4.7 hat 40% der Prompts zerstört; Lösung war die Strukturierung von CLAUDE.md und Skills

Erstellen von API-Endpunkten mit Claude: Praktische Prompt-Engineering-Lektionen aus einem 70+-Endpunkte-Projekt