OpenClaw-Kosten um 80% senken: Modellwechsel-Tutorial

Ein Reddit-Nutzer protokollierte zwei Wochen lang manuell jede Interaktion mit seinem OpenClaw-Agenten, um herauszufinden, wohin sein Geld floss. Die Ergebnisse sind ein klarer Bauplan zur Optimierung der Ausgaben für KI-Agenten.

Die Aufschlüsselung

Über 14 Tage hinweg bei einem Telegram + Discord Agenten verteilte sich die Token-Nutzung wie folgt:

Heartbeats (30-minütige Abfragen) — 38 % der Nutzung. Liefen auf Opus zu ~6,75 $/M Token. Völlige Verschwendung für einen Status-Ping.
Datei-Lesevorgänge und Zusammenfassungen — 29 % der Nutzung. Ebenfalls auf Opus. Flash erledigt diese identisch.
Tatsächliche Unterhaltungen — 22 % der Nutzung. Hier ist die Modellqualität wichtig.
Komplexe Aufgaben — 11 % der Nutzung. Hier übertrifft Opus Flash tatsächlich.

Insgesamt entfielen 67 % der Ausgaben auf Aufgaben, bei denen DeepSeek V4 Flash (0,14 $/M) die gleiche Qualität wie Opus (effektiv 6,75 $/M nach Tokenizer) geliefert hätte.

Die Lösung: Standardmäßig Flash, nur bei Bedarf eskalieren

Setzen Sie Ihr primäres Modell in openclaw.json auf deepseek/deepseek-v4-flash:

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}

Verwenden Sie dann während der Sitzung /model anthropic/claude-opus-4-7, wenn Sie auf etwas wirklich Schwieriges stoßen. Der Wechsel erfolgt sofort – kein Neustart, dieselbe Sitzung. Geben Sie /model deepseek/deepseek-v4-flash ein, wenn Sie fertig sind, um wieder auf günstig umzuschalten.

Ergebnisse

Die Kosten sanken von ~170 $/Monat auf ~35 $/Monat. Der Qualitätsunterschied bei Heartbeats, Datei-Lesevorgängen und einfachen Fragen war buchstäblich null.

Der Benutzer merkt an, dass BetterClaws kostenlose Stufe (mit BYOK) jetzt die API-Ausgaben pro Aufgabe anzeigt, was die Verschwendung durch Heartbeats sofort aufgezeigt hätte. Aber der Kern – die Umstellung auf Flash als Primärmodell und das Hochschalten auf Opus nur bei Bedarf – ist die eigentliche Erkenntnis.

📖 Quelle: r/openclaw

So senken Sie OpenClaw-Agent-Kosten um 80 % durch Modellwechsel

Die Aufschlüsselung

Die Lösung: Standardmäßig Flash, nur bei Bedarf eskalieren

Ergebnisse

👀 Siehe auch

Verwendung von OpenClaw Cron-Jobs für geplante Aufgaben anstelle von Heartbeat-Überwachung

Wie die Weiterleitung einfacher Aufgaben an günstigere Modelle die KI-Kosten um 40 % senkte

iCloud Desktop/Dokumente-Synchronisation verursacht Dateiverlustprobleme mit Claude auf Mac

Claude Code Selbstüberprüfung findet 3 GB Müll in ~/.claude — Hier ist, wie man es säubert