OpenClaw-Agenten kostenlos ausführen: Cloud-APIs vs. lokale Modelle

Diese Anleitung behandelt praktische Methoden, um OpenClaw KI-Coding-Agenten ohne Geldausgaben zu betreiben, basierend auf den Erfahrungen eines Reddit-Nutzers, der einen Agenten über einen Monat lang kostenlos laufen ließ.

Einrichtung kostenloser Cloud-Modelle

Für Nutzer ohne dedizierte Hardware bieten kostenlose Cloud-API-Tarife den einfachsten Einstieg. Die Quelle nennt drei Hauptoptionen:

OpenRouter: Registrierung ohne Kreditkarte für Zugang zu 30+ kostenlosen Modellen, darunter Nemotron Ultra 253B (262K Kontext), Llama 3.3 70B, MiniMax M2.5 und Devstral. Die Konfiguration verwendet JSON:
```
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "openrouter/nvidia/nemotron-ultra-253b:free"
      }
    }
  }
}
```
Alternativ kann OpenRouters kostenloser Router verwendet werden: "primary": "openrouter/openrouter/free"
Gemini kostenloser Tarif: API-Schlüssel von ai.google.dev erhalten, dann openclaw onboard ausführen und Google auswählen. Der kostenlose Tarif ist für gelegentliche tägliche Nutzung großzügig genug.
Groq: Schnelle Inferenz mit ratenbegrenztem kostenlosen Tarif. Registrieren, API-Schlüssel erhalten und GROQ_API_KEY setzen.

Die Quelle weist darauf hin, dass kostenlose Cloud-Modelle mit Ihren Daten trainieren, was sie für sensible Informationen ungeeignet macht. Ratenbegrenzungen werden bei 10-20+ täglichen Interaktionen spürbar.

Lokale Modelle über Ollama

Ollama wurde im März 2026 zum offiziellen OpenClaw-Anbieter. Die Einrichtung umfasst:

# ollama installieren
curl -fsSL https://ollama.com/install.sh | sh
# ein Modell basierend auf Ihrer Hardware pullen
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (MoE-Modell)
ollama pull qwen3.5:9b # 8GB VRAM (die meisten Laptops)
# openclaw onboarding ausführen und Ollama auswählen
openclaw onboard

Wenn die automatische Erkennung fehlschlägt oder Ollama auf einem anderen Rechner läuft: export OLLAMA_API_KEY="ollama-local"

Drei kritische Konfigurationstipps aus der Quelle:

Verwenden Sie die native Ollama-URL (http://localhost:11434), NICHT den OpenAI-kompatiblen Endpunkt (http://localhost:11434/v1). Der /v1-Pfad unterbricht Tool Calling.
Setzen Sie "reasoning": false in manuellen Modellkonfigurationen. Wenn aktiviert, sendet OpenClaw Prompts als "developer"-Rolle, die Ollama nicht unterstützt.
Setzen Sie "api": "ollama" explizit in der Provider-Konfiguration, um natives Tool-Calling-Verhalten sicherzustellen.

Die Quelle stellt fest, dass lokale Modelle auf leistungsstarken Maschinen (Mac Studio, 3090/4090, 32GB+ RAM) für grundlegende Agentenaufgaben gut funktionieren. Auf Laptops mit 8GB und 9B-Modellen ist die Leistung langsamer mit niedrigeren Qualitätsgrenzen. Qwen3.5 bewältigt Tool Calling für tägliche Aufgaben angemessen.

Hybrid-Einrichtung

Das tatsächliche Setup des Autors verwendet Ollama/Qwen3.5 27B lokal für etwa 70% der täglichen Aufgaben (Dateilesen, Kalender, Zusammenfassungen, schnelle Nachschlagevorgänge), mit dem OpenRouter kostenlosen Tarif als Fallback für komplexe mehrstufige Schlussfolgerungen. Die monatlichen Gesamtkosten bleiben unter 3$.

Dieser Ansatz ist speziell für Nutzer gedacht, die buchstäblich nichts oder fast nichts ausgeben möchten. Für diejenigen, die "günstig" statt kostenlos bevorzugen, nennt die Quelle DeepSeek V3.2 (~1-2$/Tag), Minimax (10$/Monat Abo) und Kimi K2.5 als äußerst kostengünstige Alternativen, die gut mit OpenClaw funktionieren.

📖 Den vollständigen Source lesen: r/openclaw

Wie man OpenClaw-Agenten kostenlos mit Cloud-APIs oder lokalen Modellen ausführt

Einrichtung kostenloser Cloud-Modelle

Lokale Modelle über Ollama

Hybrid-Einrichtung

👀 Siehe auch

9 Claude-Fähigkeiten für das Einzelstudio aufbauen: Anweisungen stapeln für echte Arbeit

Praktischer Leitfaden zur Erstellung von Claude Skills: Struktur, Auslöser und Skripte

Empfehlungen für die Einrichtung eines lokalen LLM für OpenClaw

Maßgeschneiderter 4x RTX PRO 6000 Server vs Dell GB300: Entscheidung für 30 feinabgestimmte Pipelines