OpenClaw-Kostenoptimierung: 750-Dollar-Fehler durch Modell-Routing behoben

Was mit der Kostenkorrektur schiefging

Nachdem der Entwickler in 3 Tagen 750 US-Dollar bei OpenRouter verbrannt hatte, „korrigierte“ er die Kosten zunächst, indem er alles auf Hunter Alpha (kostenlos bei OpenRouter) umstellte. Dies führte dazu, dass Subagenten keine Ausgabe lieferten – stille Abschlüsse, bei denen Jobs als „erfolgreich“ angezeigt wurden, die Ergebnisse jedoch leer waren.

Ein konkreter Fehlerfall: Ein Videoproduktionsagent schrieb Code, der syntaktisch korrekt prüfte, fehlerfrei lief, aber ein 9-sekündiges stummes schwarzes Video ohne Voiceover, ohne Filmmaterial und ohne Manifest erzeugte. Die Qualitätssicherung entdeckte es schließlich. Die Lehre: Kostenlose Modelle scheitern nicht immer laut – manchmal liefern sie leise einen Stub und machen weiter.

Die neue Modellrouting-Strategie

Der Entwickler hörte auf, an „billig vs. teuer“ zu denken, und begann zu überlegen: „Was braucht diese Aufgabe tatsächlich“:

Hauptsession (Orchestrierung): Sonnet 4.6 – „Der Manager. Den Preis wert.“
Code/komplexe Aufgaben: Gemini 2.5 Flash zu 0,15 US-Dollar/M – „Der Sweet Spot für echte Ausgabe.“
Sensible Daten (Zugangsdaten, Finanzen): Claude 3.5 Haiku – „Anthropic protokolliert keine Prompts. Nicht verhandelbar.“
Einfache vorhersehbare Aufgaben: Hunter Alpha – „In Ordnung, wenn Fehler offensichtlich sind und das Risiko gering ist.“

Jeder Cron-Job und jede Subagenten-Erstellung hat jetzt einen expliziten Modellparameter – keine Standardwerte.

Sicherheitsentdeckung während der Überprüfung

Bei der Untersuchung der Modellprobleme fand der Entwickler Zugangsdaten in seinem Workspace-Repo – API-Schlüssel und OAuth-Tokens. Obwohl nicht öffentlich gepusht, war dies inakzeptabel. Er fügte eine .gitignore für credentials/ hinzu und führte git rm --cached aus. Die Warnung: Wenn Sie jemals einen Credentials-Ordner committet haben, bleiben diese Schlüssel in Ihrer Git-Historie – rotieren Sie sie.

Die Kernlehre

Kostenoptimierung ist keine einmalige Konfigurationsänderung. Ein Modell für 0,15 US-Dollar/M, das Ihre Produktionspipeline schreibt, ist gut angelegtes Geld. Ein kostenloses Modell, das Ihnen leise ein kaputtes Video übergibt, ist teuer, egal was es pro Token kostet. Passen Sie die Größe an die Aufgabe an und überprüfen Sie die Ausgabe, nicht nur Exit-Codes.

📖 Read the full source: r/openclaw

OpenClaw-Kostenoptimierung: Wie ein Entwickler einen 750-Dollar-Fehler mit Modell-Routing behoben hat

Was mit der Kostenkorrektur schiefging

Die neue Modellrouting-Strategie

Sicherheitsentdeckung während der Überprüfung

Die Kernlehre

👀 Siehe auch

Praktische KI-Agenten-Einrichtungen für Kleinunternehmen: Friseur, Therapeut, Rechtsanwaltskanzlei, Content Creator und Spieleentwickler

Ein Prompt, der 200 Investorenkontakte via Claude Code findet, mailt und protokolliert

Finanzmodellierer entwickelt lokale Sprach-zu-Werkzeug-Desktop-App mit Claude Code

OpenClaw-Testagent für mobile Apps: Einrichtung und Ergebnisse