Wie man unerwartete OpenRouter-Kosten in der OpenClaw-Automatisierung vermeidet

✍️ OpenClawRadar📅 Veröffentlicht: 15. März 2026🔗 Source
Wie man unerwartete OpenRouter-Kosten in der OpenClaw-Automatisierung vermeidet
Ad

Ein Entwicklerteam teilte seine Erfahrung, versehentlich 750 US-Dollar in drei Tagen ausgegeben zu haben, während es Automatisierungspipelines auf OpenClaw mit OpenRouter betrieb. Die Kosten entstanden durch 25 automatische OpenRouter-Aufladungen à 28,96 US-Dollar plus 25 US-Dollar für die X-API.

Was schiefging

Das Team baute vom 12. bis 14. März eine Automatisierungspipeline, die Sportvorhersagen, Videoproduktion, Qualitätssicherung und Verteilung umfasste. Cron-Jobs liefen nach Zeitplan, wobei Subagenten für jede Aufgabe gestartet wurden. Alles verwendete standardmäßig Claude Sonnet 4.6 zu 3 US-Dollar pro Million Tokens, ohne dass sie es wussten. Ein 6-minütiger Cron-Job für Sportvorhersagen mit Websuchen verbrauchte etwa 120 US-Dollar in einem einzigen Durchlauf.

Die Lösung: 97 % Kostenreduktion

Mit Konfigurationsänderungen kostet die gleiche Arbeitslast nun geschätzt 15–20 US-Dollar. Hier sind die spezifischen Änderungen, die sie vorgenommen haben:

  • Standardmodell geändert: In openclaw.json tauschten sie das teure Standardmodell gegen Hunter Alpha (kostenlos auf OpenRouter):
    "agents": {
      "defaults": {
        "models": {
          "default": "openrouter/hunter-alpha",
          "fast": "openrouter/hunter-alpha",
          "thinking": "openrouter/openrouter/hunter-alpha"
        }
      }
    }
  • Cron-Jobs auf ein günstiges Modell festgelegt: Cron-Jobs übernehmen das Standardmodell. Überschreiben Sie sie explizit mit:
    openclaw cron edit  --model "openrouter/hunter-alpha"
    Tun Sie dies für jeden Cron-Job.
  • Subagent-Starts festgelegt: Subagenten übernehmen ebenfalls Standardeinstellungen. Geben Sie beim Starten das Modell an:
    sessions_spawn(..., model="openrouter/hunter-alpha")
  • Teure Modelle für sensible Arbeiten reserviert: Sie behielten Claude 3.5 Haiku (0,25 US-Dollar/Mio.) für alles mit Anmeldedaten oder persönlichen Daten aufgrund der Datenschutzrichtlinie von Anthropic (keine Protokollierung von Eingabeaufforderungen). Sie verwenden Gemini 2.5 Flash (0,15 US-Dollar/Mio.), wenn sie komplexeres Denken benötigen. Sonnet ist in ihrem Setup effektiv außer Betrieb, es sei denn, es wird explizit aufgerufen.
Ad

Erkenntnisse

  • Überprüfen Sie sofort Ihr Standardmodell. Wenn es ein Premium-Modell ist, verbrennt jede Sitzung, jeder Cron-Job und jeder Subagent Geld.
  • Cron-Jobs sind heimtückisch – sie laufen leise nach Zeitplan und können pro Durchlauf über 100 US-Dollar kosten, ohne dass man es merkt.
  • Subagent-Starts übernehmen Standardeinstellungen. Wenn Ihre Hauptsitzung auf Sonnet läuft und Sie 10 Subagenten starten, laufen alle 10 auf Sonnet, sofern nicht anders angegeben.
  • Hunter Alpha ist kostenlos, aber NICHT privat – alle Eingabeaufforderungen werden protokolliert. Verwenden Sie es nicht für Finanzdaten, Anmeldedaten oder sensible Informationen.
  • Teure Modelle lohnen sich als Option, nicht als Standard. Sonnet sollte nicht Ihre Cron-Jobs um 3 Uhr morgens ausführen.
  • Achten Sie auf Ihre E-Mails – diese 28,96 US-Dollar OpenRouter-Aufladungen summieren sich schnell.

Das Fazit: OpenClaw ist leistungsstark, kümmert sich aber nicht um Kosten. Ein paar Konfigurationszeilen können den Unterschied zwischen einer 15-US-Dollar-Automatisierungspipeline und einer 750-US-Dollar-Überraschung ausmachen.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

OpenClaw v2.0-Update: Wichtige Checkliste vor dem Update, um Breaking Changes zu vermeiden
Anleitungen

OpenClaw v2.0-Update: Wichtige Checkliste vor dem Update, um Breaking Changes zu vermeiden

Das neueste Update von OpenClaw führt 12 Breaking Changes ein, ein neues Plugin-System und über 30 Sicherheitspatches. Diese Anleitung beschreibt fünf wesentliche Prüfungen, die vor dem Update durchgeführt werden sollten, einschließlich der Umbenennung von Umgebungsvariablen, der Migration des Zustandsverzeichnisses und der Neukonfiguration der Browser-Automatisierung.

OpenClawRadar
DeepSeek-V4-Flash W4A16+FP8 mit MTP-Selbstspekulation: 85 tok/s auf 2x RTX PRO 6000 Max-Q
Anleitungen

DeepSeek-V4-Flash W4A16+FP8 mit MTP-Selbstspekulation: 85 tok/s auf 2x RTX PRO 6000 Max-Q

DeepSeek-V4-Flash quantisiert auf W4A16+FP8 erreicht 85,52 Tok/s bei 524k Kontext auf 2× RTX PRO 6000 Max-Q mit einem gepatchten vLLM und nachgerüstetem MTP-Head, gegenüber 52,85 Tok/s Basislinie.

OpenClawRadar
Workaround für den Zugriff auf OpenClaw Claude über die Claude Code CLI
Anleitungen

Workaround für den Zugriff auf OpenClaw Claude über die Claude Code CLI

Eine Methode leitet OpenClaw über die Claude Code CLI, um den Zugang zum Claude-Abonnement aufrechtzuerhalten, nachdem Anthropic direkte Drittanbieter-Schnittstellen blockiert hat. Der Prozess umfasst die Installation der CLI, die Einrichtung eines OAuth-Tokens und die Konfiguration von OpenClaw zur Verwendung des ACP-Plugins.

OpenClawRadar
Qwen3.6-35B-A3B mit ~190K Kontext auf 8 GB VRAM + 32 GB RAM ausführen – Einrichtung und Benchmarks
Anleitungen

Qwen3.6-35B-A3B mit ~190K Kontext auf 8 GB VRAM + 32 GB RAM ausführen – Einrichtung und Benchmarks

Ein Reddit-Nutzer teilt eine funktionierende llama.cpp-Konfiguration für Qwen3.6-35B-A3B GGUF-Modelle auf einer RTX 4060 (8 GB VRAM) + 32 GB DDR5, die 37-51 tok/s bei 192k Kontext mit TurboQuant und spezifischen Flags erreicht.

OpenClawRadar