OpenClaw-Kostenoptimierung: Wie ein Entwickler einen 750-Dollar-Fehler mit Modell-Routing behoben hat

Was mit der Kostenkorrektur schiefging
Nachdem der Entwickler in 3 Tagen 750 US-Dollar bei OpenRouter verbrannt hatte, „korrigierte“ er die Kosten zunächst, indem er alles auf Hunter Alpha (kostenlos bei OpenRouter) umstellte. Dies führte dazu, dass Subagenten keine Ausgabe lieferten – stille Abschlüsse, bei denen Jobs als „erfolgreich“ angezeigt wurden, die Ergebnisse jedoch leer waren.
Ein konkreter Fehlerfall: Ein Videoproduktionsagent schrieb Code, der syntaktisch korrekt prüfte, fehlerfrei lief, aber ein 9-sekündiges stummes schwarzes Video ohne Voiceover, ohne Filmmaterial und ohne Manifest erzeugte. Die Qualitätssicherung entdeckte es schließlich. Die Lehre: Kostenlose Modelle scheitern nicht immer laut – manchmal liefern sie leise einen Stub und machen weiter.
Die neue Modellrouting-Strategie
Der Entwickler hörte auf, an „billig vs. teuer“ zu denken, und begann zu überlegen: „Was braucht diese Aufgabe tatsächlich“:
- Hauptsession (Orchestrierung): Sonnet 4.6 – „Der Manager. Den Preis wert.“
- Code/komplexe Aufgaben: Gemini 2.5 Flash zu 0,15 US-Dollar/M – „Der Sweet Spot für echte Ausgabe.“
- Sensible Daten (Zugangsdaten, Finanzen): Claude 3.5 Haiku – „Anthropic protokolliert keine Prompts. Nicht verhandelbar.“
- Einfache vorhersehbare Aufgaben: Hunter Alpha – „In Ordnung, wenn Fehler offensichtlich sind und das Risiko gering ist.“
Jeder Cron-Job und jede Subagenten-Erstellung hat jetzt einen expliziten Modellparameter – keine Standardwerte.
Sicherheitsentdeckung während der Überprüfung
Bei der Untersuchung der Modellprobleme fand der Entwickler Zugangsdaten in seinem Workspace-Repo – API-Schlüssel und OAuth-Tokens. Obwohl nicht öffentlich gepusht, war dies inakzeptabel. Er fügte eine .gitignore für credentials/ hinzu und führte git rm --cached aus. Die Warnung: Wenn Sie jemals einen Credentials-Ordner committet haben, bleiben diese Schlüssel in Ihrer Git-Historie – rotieren Sie sie.
Die Kernlehre
Kostenoptimierung ist keine einmalige Konfigurationsänderung. Ein Modell für 0,15 US-Dollar/M, das Ihre Produktionspipeline schreibt, ist gut angelegtes Geld. Ein kostenloses Modell, das Ihnen leise ein kaputtes Video übergibt, ist teuer, egal was es pro Token kostet. Passen Sie die Größe an die Aufgabe an und überprüfen Sie die Ausgabe, nicht nur Exit-Codes.
📖 Read the full source: r/openclaw
👀 Siehe auch

Claude Code KI-Agent steuert physisches iPhone über Barrierefreiheits-APIs
Ein Entwickler demonstrierte, wie Claude Code autonom ein physisches iPhone über die Blitz Mac App steuert, wobei WebDriverAgent und Barrierefreiheits-APIs mit einem Null-Abstand-Swipe-Workaround für Taps verwendet werden.

Lokales Multi-Agenten-AI-Setup auf WSL mit OpenClaw und Ollama
Ein Entwickler teilt seine Architektur für den Betrieb eines Multi-Agenten-KI-Systems auf WSL Ubuntu 24.04 mit OpenClaw als Gateway, mit vier spezialisierten Agenten, darunter einem, der lokal auf Ollama läuft, um keine API-Kosten zu verursachen.

Mehrfenster-Claude-Code-Einrichtung mit Rollentrennung und Ausführungshooks
Ein Entwickler teilt ein Setup mit vier iTerm2-Fenstern mit separaten Claude Code-Instanzen für Implementierung, Überprüfung, Planung und Prompt-Verfeinerung, plus Pre- und Post-Tool-Use-Hooks für Sicherheit und ein Sitzungsprotokoll für Kontextbewahrung.
Lokale vs. VPS OpenClaw-Bereitstellung: praktische Unterschiede für KI-Coding-Agenten
Die lokale Ausführung von OpenClaw bietet echten Browserzugriff mit bestehenden Anmeldesitzungen und lokalen Dateizugriff, während die VPS-Bereitstellung die Funktionalität auf grundlegende Aufgaben beschränkt und auf Website-Einschränkungen stößt.