Zwei $0 OpenClaw-Einrichtungen mit kostenlosen Cloud-Modellen oder lokalem Ollama

Ein OpenClaw-Nutzer berichtet, dass er einen Agenten drei Wochen lang kostenlos betrieben hat und dabei etwa 70 % der Aufgaben bewältigte, für die er zuvor mit Claude bezahlt hatte. Das Setup bietet zwei Wege: kostenlose Cloud-Modelle mit Ratenbegrenzungen oder lokale Modelle über Ollama ohne laufende Kosten.
Weg 1: Kostenlose Cloud-Modelle (keine Hardware erforderlich)
Dieser Ansatz erfordert nur eine bestehende OpenClaw-Installation und kostenlose API-Tarife:
- OpenRouter kostenloser Tarif: Registrieren Sie sich unter openrouter.ai ohne Kreditkarte. Bietet 30+ kostenlose Modelle, darunter Llama 3.3 70B, Nemotron Ultra 253B (262K Kontext), MiniMax M2.5 und Devstral. Konfigurationsbeispiel:
{
"env": { "OPENROUTER_API_KEY": "sk-or-..." },
"agents": {
"defaults": {
"model": {
"primary": "openrouter/nvidia/nemotron-ultra-253b:free"
}
}
}
}
Für automatische Modellauswahl: "primary": "openrouter/openrouter/free"
- Gemini kostenloser Tarif: Google bietet 15 Anfragen pro Minute für Gemini Flash kostenlos an. Holen Sie sich einen API-Schlüssel von ai.google.dev und führen Sie
openclaw onboardaus, wählen Sie Google als integrierten Anbieter. - Groq: Schnell mit kostenlosem, ratenbeschränktem Tarif, geeignet für grundlegende Agentenaufgaben.
Der Haken: Ratenbegrenzungen. Bei leichter bis moderater täglicher Nutzung (10-20 Interaktionen) sind Pausen kaum spürbar. Für 100+ Aufgaben täglich funktioniert dies nicht.
Weg 2: Lokale Modelle über Ollama (wirklich 0 €, für immer)
Ollama wurde im März 2026 offizieller OpenClaw-Anbieter. Dieses Setup hat keine API-Schlüssel, Konten, Ratenbegrenzungen und keine Daten verlassen Ihren Computer.
Einrichtungsschritte:
- Ollama installieren:
curl -fsSL https://ollama.com/install.sh | sh - Ein Modell basierend auf Ihrem VRAM laden:
- 20GB+ VRAM (RTX 3090, 4090, M4 Pro/Max):
ollama pull qwen3.5:27b - 16GB VRAM:
ollama pull qwen3.5:35b-a3b - 8GB VRAM (die meisten Laptops):
ollama pull qwen3.5:9b
- 20GB+ VRAM (RTX 3090, 4090, M4 Pro/Max):
- Führen Sie
openclaw onboardaus und wählen Sie Ollama, oder verwenden Sie die manuelle Einrichtung mitexport OLLAMA_API_KEY="ollama-local"
Qwen3.5 27B wird als aktueller Sweet Spot für OpenClaw angesehen, der Tool-Aufrufe gut für tägliche Agentenaufgaben bewältigt. Die 35b-a3b Mixture-of-Experts-Variante läuft mit 112 Tokens/Sekunde auf einer RTX 3090, indem nur 3B Parameter gleichzeitig aktiviert werden.
Manuelles Konfigurationsbeispiel:
{
"models": {
"providers": {
"ollama": {
"baseUrl": "http://localhost:11434",
"apiKey": "ollama-local",
"api": "ollama",
"models": [
{
"id": "qwen3.5:27b",
"name": "Qwen3.5 27B",
"reasoning": false,
"contextWindow": 131072,
"maxTokens": 8192
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "ollama/qwen3.5:27b"
}
}
}
}
Wichtige Debugging-Hinweise:
- Verwenden Sie die native Ollama-API-URL (
http://localhost:11434), NICHT die OpenAI-kompatible (http://localhost:11434/v1). Der /v1-Pfad unterbricht Tool-Aufrufe, was zu roher JSON-Ausgabe als Klartext führt. - Setzen Sie
"reasoning": falsein der Modellkonfiguration.
📖 Read the full source: r/clawdbot
👀 Siehe auch

30 Tage Claude für das Freelancer-Business: 5 Prompts, die funktionieren
Ein Freiberufler hat Claude 30 Tage lang täglich getestet und teilt 5 Prompts, die die Angebotserstellung von 45 auf 5 Minuten verkürzt, die Preise um 30 % ohne Widerstand erhöht und die Antwortrate bei Kaltakquise verdreifacht haben.

Praktischer Claude-Code-Workflow für Entwicklungsteams
Ein Reddit-Nutzer teilt seine interne Präsentation zu Claude Code Best Practices, einschließlich Modellauswahl, strukturierter Arbeitsabläufe und spezifischer Prompt-Techniken zur Verbesserung der Ausgabequalität.

vLLM-Einrichtung und -Tests auf einem 10x-NVIDIA-V100-Server mit 320 GB VRAM
Ein Anwalt, der einen lokalen KI-Server für juristische Arbeiten aufbaut, teilt vLLM-Testergebnisse auf 10x Tesla V100 SXM2 32GB GPUs mit und erläutert, was funktioniert (FP16 unquantisiert, bitsandbytes 4-Bit) und was nicht (GPTQ, AWQ, FlashAttention2) auf der Volta-Architektur.

Anleitung zur Einrichtung von OpenClaw auf einem Hostinger VPS
Eine Schritt-für-Schritt-Anleitung zur Bereitstellung von OpenClaw auf einem Hostinger VPS, zur Verbindung von KI-APIs von OpenAI und Entropics und zur Integration mit Telegram für einen 24/7-Betrieb.