Wie man OpenClaw-Agenten kostenlos mit Cloud-APIs oder lokalen Modellen ausführt

✍️ OpenClawRadar📅 Veröffentlicht: 14. April 2026🔗 Source
Wie man OpenClaw-Agenten kostenlos mit Cloud-APIs oder lokalen Modellen ausführt
Ad

Diese Anleitung behandelt praktische Methoden, um OpenClaw KI-Coding-Agenten ohne Geldausgaben zu betreiben, basierend auf den Erfahrungen eines Reddit-Nutzers, der einen Agenten über einen Monat lang kostenlos laufen ließ.

Einrichtung kostenloser Cloud-Modelle

Für Nutzer ohne dedizierte Hardware bieten kostenlose Cloud-API-Tarife den einfachsten Einstieg. Die Quelle nennt drei Hauptoptionen:

  • OpenRouter: Registrierung ohne Kreditkarte für Zugang zu 30+ kostenlosen Modellen, darunter Nemotron Ultra 253B (262K Kontext), Llama 3.3 70B, MiniMax M2.5 und Devstral. Die Konfiguration verwendet JSON:
    {
      "agents": {
        "defaults": {
          "model": {
            "primary": "openrouter/nvidia/nemotron-ultra-253b:free"
          }
        }
      }
    }
    Alternativ kann OpenRouters kostenloser Router verwendet werden: "primary": "openrouter/openrouter/free"
  • Gemini kostenloser Tarif: API-Schlüssel von ai.google.dev erhalten, dann openclaw onboard ausführen und Google auswählen. Der kostenlose Tarif ist für gelegentliche tägliche Nutzung großzügig genug.
  • Groq: Schnelle Inferenz mit ratenbegrenztem kostenlosen Tarif. Registrieren, API-Schlüssel erhalten und GROQ_API_KEY setzen.

Die Quelle weist darauf hin, dass kostenlose Cloud-Modelle mit Ihren Daten trainieren, was sie für sensible Informationen ungeeignet macht. Ratenbegrenzungen werden bei 10-20+ täglichen Interaktionen spürbar.

Ad

Lokale Modelle über Ollama

Ollama wurde im März 2026 zum offiziellen OpenClaw-Anbieter. Die Einrichtung umfasst:

# ollama installieren
curl -fsSL https://ollama.com/install.sh | sh
# ein Modell basierend auf Ihrer Hardware pullen
ollama pull qwen3.5:27b # 20GB+ VRAM (RTX 3090/4090, M4 Pro/Max)
ollama pull qwen3.5:35b-a3b # 16GB VRAM (MoE-Modell)
ollama pull qwen3.5:9b # 8GB VRAM (die meisten Laptops)
# openclaw onboarding ausführen und Ollama auswählen
openclaw onboard

Wenn die automatische Erkennung fehlschlägt oder Ollama auf einem anderen Rechner läuft: export OLLAMA_API_KEY="ollama-local"

Drei kritische Konfigurationstipps aus der Quelle:

  • Verwenden Sie die native Ollama-URL (http://localhost:11434), NICHT den OpenAI-kompatiblen Endpunkt (http://localhost:11434/v1). Der /v1-Pfad unterbricht Tool Calling.
  • Setzen Sie "reasoning": false in manuellen Modellkonfigurationen. Wenn aktiviert, sendet OpenClaw Prompts als "developer"-Rolle, die Ollama nicht unterstützt.
  • Setzen Sie "api": "ollama" explizit in der Provider-Konfiguration, um natives Tool-Calling-Verhalten sicherzustellen.

Die Quelle stellt fest, dass lokale Modelle auf leistungsstarken Maschinen (Mac Studio, 3090/4090, 32GB+ RAM) für grundlegende Agentenaufgaben gut funktionieren. Auf Laptops mit 8GB und 9B-Modellen ist die Leistung langsamer mit niedrigeren Qualitätsgrenzen. Qwen3.5 bewältigt Tool Calling für tägliche Aufgaben angemessen.

Hybrid-Einrichtung

Das tatsächliche Setup des Autors verwendet Ollama/Qwen3.5 27B lokal für etwa 70% der täglichen Aufgaben (Dateilesen, Kalender, Zusammenfassungen, schnelle Nachschlagevorgänge), mit dem OpenRouter kostenlosen Tarif als Fallback für komplexe mehrstufige Schlussfolgerungen. Die monatlichen Gesamtkosten bleiben unter 3$.

Dieser Ansatz ist speziell für Nutzer gedacht, die buchstäblich nichts oder fast nichts ausgeben möchten. Für diejenigen, die "günstig" statt kostenlos bevorzugen, nennt die Quelle DeepSeek V3.2 (~1-2$/Tag), Minimax (10$/Monat Abo) und Kimi K2.5 als äußerst kostengünstige Alternativen, die gut mit OpenClaw funktionieren.

📖 Den vollständigen Source lesen: r/openclaw

Ad

👀 Siehe auch

Maximierung der KI-Agentenfähigkeiten in OpenClaw
Anleitungen

Maximierung der KI-Agentenfähigkeiten in OpenClaw

Die KI von OpenClaw kann optimiert werden, indem das richtige Modell ausgewählt und ein spezifischer Systemkontext bereitgestellt wird. Die Qwen-Modelle zeichnen sich durch ihren Werkzeuggebrauch aus, was für autonome Workflows entscheidend ist.

OpenClawRadar
Claude Code über Ollama leiten und Ihre Rechnung um ~90% senken
Anleitungen

Claude Code über Ollama leiten und Ihre Rechnung um ~90% senken

Claude Desktop mit Ollama-gestütztem Claude Code kombinieren: Strategische Aufgaben bleiben bei Anthropic, schwere Arbeiten laufen auf kostenlosen Open-Source-Modellen wie Gemma, Qwen, DeepSeek. Inklusive eines Copy-Paste-Prompts, der ~98% der Einrichtung automatisiert.

OpenClawRadar
OpenClaw 3.22 Upgrade-Checkliste: Praktische Schritte von einem Entwickler, der sich die Finger verbrannt hat
Anleitungen

OpenClaw 3.22 Upgrade-Checkliste: Praktische Schritte von einem Entwickler, der sich die Finger verbrannt hat

Ein Entwickler teilt spezifische Upgrade-Schritte für OpenClaw 3.22, einschließlich der Überprüfung veralteter Umgebungsvariablen, dem Erstellen von Backups, dem Ausführen von Migrationsbefehlen und der Überprüfung der Plugin-Kompatibilität.

OpenClawRadar
Entwurf von Einschränkungen für die Zuverlässigkeit von KI-Agenten in Produktionsumgebungen
Anleitungen

Entwurf von Einschränkungen für die Zuverlässigkeit von KI-Agenten in Produktionsumgebungen

Ein Reddit-Beitrag beschreibt einen einschränkungsbasierten Ansatz zur Nutzung von Claude für komplexe Codebasis-Operationen. Dabei werden explizite Aufzählungen von Fehlermodi, gestaffelte Ausführung mit Kontrollpunkten und Anti-Kurzschluss-Regeln betont, um beim Entfernen von 140 Dateien keine fehlerhaften Builds zu erzeugen.

OpenClawRadar