Wie man OpenClaw-Agenten kostenlos mit Cloud-APIs oder lokalen Modellen ausführt

Diese Anleitung behandelt praktische Methoden, um OpenClaw KI-Coding-Agenten ohne Geldausgaben zu betreiben, basierend auf den Erfahrungen eines Reddit-Nutzers, der einen Agenten über einen Monat lang kostenlos laufen ließ.
Einrichtung kostenloser Cloud-Modelle
Für Nutzer ohne dedizierte Hardware bieten kostenlose Cloud-API-Tarife den einfachsten Einstieg. Die Quelle nennt drei Hauptoptionen:
- OpenRouter: Registrierung ohne Kreditkarte für Zugang zu 30+ kostenlosen Modellen, darunter Nemotron Ultra 253B (262K Kontext), Llama 3.3 70B, MiniMax M2.5 und Devstral. Die Konfiguration verwendet JSON:
Alternativ kann OpenRouters kostenloser Router verwendet werden:{ "agents": { "defaults": { "model": { "primary": "openrouter/nvidia/nemotron-ultra-253b:free" } } } }"primary": "openrouter/openrouter/free" - Gemini kostenloser Tarif: API-Schlüssel von ai.google.dev erhalten, dann
openclaw onboardausführen und Google auswählen. Der kostenlose Tarif ist für gelegentliche tägliche Nutzung großzügig genug. - Groq: Schnelle Inferenz mit ratenbegrenztem kostenlosen Tarif. Registrieren, API-Schlüssel erhalten und
GROQ_API_KEYsetzen.
Die Quelle weist darauf hin, dass kostenlose Cloud-Modelle mit Ihren Daten trainieren, was sie für sensible Informationen ungeeignet macht. Ratenbegrenzungen werden bei 10-20+ täglichen Interaktionen spürbar.
Lokale Modelle über Ollama
Ollama wurde im März 2026 zum offiziellen OpenClaw-Anbieter. Die Einrichtung umfasst:
# ollama installieren
curl -fsSL https://ollama.com/install.sh | sh
# ein Modell basierend auf Ihrer Hardware pullen
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (MoE-Modell)
ollama pull qwen3.5:9b # 8GB VRAM (die meisten Laptops)
# openclaw onboarding ausführen und Ollama auswählen
openclaw onboardWenn die automatische Erkennung fehlschlägt oder Ollama auf einem anderen Rechner läuft: export OLLAMA_API_KEY="ollama-local"
Drei kritische Konfigurationstipps aus der Quelle:
- Verwenden Sie die native Ollama-URL (
http://localhost:11434), NICHT den OpenAI-kompatiblen Endpunkt (http://localhost:11434/v1). Der /v1-Pfad unterbricht Tool Calling. - Setzen Sie
"reasoning": falsein manuellen Modellkonfigurationen. Wenn aktiviert, sendet OpenClaw Prompts als "developer"-Rolle, die Ollama nicht unterstützt. - Setzen Sie
"api": "ollama"explizit in der Provider-Konfiguration, um natives Tool-Calling-Verhalten sicherzustellen.
Die Quelle stellt fest, dass lokale Modelle auf leistungsstarken Maschinen (Mac Studio, 3090/4090, 32GB+ RAM) für grundlegende Agentenaufgaben gut funktionieren. Auf Laptops mit 8GB und 9B-Modellen ist die Leistung langsamer mit niedrigeren Qualitätsgrenzen. Qwen3.5 bewältigt Tool Calling für tägliche Aufgaben angemessen.
Hybrid-Einrichtung
Das tatsächliche Setup des Autors verwendet Ollama/Qwen3.5 27B lokal für etwa 70% der täglichen Aufgaben (Dateilesen, Kalender, Zusammenfassungen, schnelle Nachschlagevorgänge), mit dem OpenRouter kostenlosen Tarif als Fallback für komplexe mehrstufige Schlussfolgerungen. Die monatlichen Gesamtkosten bleiben unter 3$.
Dieser Ansatz ist speziell für Nutzer gedacht, die buchstäblich nichts oder fast nichts ausgeben möchten. Für diejenigen, die "günstig" statt kostenlos bevorzugen, nennt die Quelle DeepSeek V3.2 (~1-2$/Tag), Minimax (10$/Monat Abo) und Kimi K2.5 als äußerst kostengünstige Alternativen, die gut mit OpenClaw funktionieren.
📖 Den vollständigen Source lesen: r/openclaw
👀 Siehe auch

vLLM-Einrichtung und -Tests auf einem 10x-NVIDIA-V100-Server mit 320 GB VRAM
Ein Anwalt, der einen lokalen KI-Server für juristische Arbeiten aufbaut, teilt vLLM-Testergebnisse auf 10x Tesla V100 SXM2 32GB GPUs mit und erläutert, was funktioniert (FP16 unquantisiert, bitsandbytes 4-Bit) und was nicht (GPTQ, AWQ, FlashAttention2) auf der Volta-Architektur.

OpenClaw 102: Aktualisierte Einrichtungstipps für Sicherheit und Effizienz
Ein Reddit-Nutzer teilt aktualisierte OpenClaw-Konfigurationsratschläge, einschließlich API-Schlüsselverschlüsselung mit Windows PowerShell-Skripten, Prompt-Injection-Abwehr in AGENTS.md, Tailscale für Fernzugriff und Anti-Loop-Regeln zur Vermeidung wiederholter Fehler.

OpenClaw v2.0-Update: Wichtige Checkliste vor dem Update, um Breaking Changes zu vermeiden
Das neueste Update von OpenClaw führt 12 Breaking Changes ein, ein neues Plugin-System und über 30 Sicherheitspatches. Diese Anleitung beschreibt fünf wesentliche Prüfungen, die vor dem Update durchgeführt werden sollten, einschließlich der Umbenennung von Umgebungsvariablen, der Migration des Zustandsverzeichnisses und der Neukonfiguration der Browser-Automatisierung.

Ausführen eines 1-Billionen-Parameter-LLM lokal auf einem AMD Ryzen AI Max+-Cluster
AMD demonstriert das Ausführen des Kimi K2.5 Open-Source-Modells (375 GB, 1 Billion Parameter) auf vier Framework Desktop-Systemen mit Ryzen AI Max+ 395 Prozessoren unter Verwendung von llama.cpp RPC. Die Anleitung behandelt TTM-Kernel-Modifikationen für 120 GB VRAM pro Knoten und bietet zwei Einrichtungsoptionen: vorgefertigte Lemonade SDK-Binärdateien oder manuelle ROCm 7.0.2-Installation.