Claude Code Kosten senken: Planung an Haiku 3.5 leiten

Ein Reddit-Nutzer berichtet, dass er im letzten Monat rund 40 $ an Zusatzgebühren bei Claude Code gespart hat, indem er die Token-Nutzung auf verschiedene Modelle aufteilte. Die entscheidende Erkenntnis: Planungsschritte (insbesondere bei Refaktorisierungen über mehrere Dateien hinweg) können bis zu 80 % des Token-Budgets verbrauchen, aber für die meisten Planungsschritte ist das teuerste Modell nicht nötig.

Wie es funktioniert

Er hat einen 30-zeiligen Wrapper geschrieben, der die anfängliche Arbeit „Herausfinden, was geändert werden muss“ an Haiku 3.5 weiterleitet – ein günstigeres Modell. Nur die eigentlichen Bearbeitungen und Entscheidungen bleiben bei Opus oder Sonnet. Die Einrichtung dauerte etwa 2 Stunden, einschließlich der Entscheidung, welche Schritte sich zur Auslagerung eignen.

Ergebnisse

Der letzte Zyklus endete zum ersten Mal seit 4 Monaten mit übrigem Budget. Der Nutzer vermied die übliche 2-tägige Wartezeit auf das Reset-Fenster. Ersparnis: rund 40 $ an Zusatzgebühren.

# Pseudocode für die Wrapper-Logik:
# 1. Sende Planungsaufforderung an haiku-3.5
# 2. Erhalte eine Liste von Dateien und Änderungen
# 3. Übergebe den Plan + Anweisung an opus/sonnet für die tatsächlichen Bearbeitungen

Einschränkungen

Haukas Planungsqualität ist bei Architekturentscheidungen merklich schlechter. Für Refaktorisierungs- und Testworkflows, bei denen Opus die eigentlichen Entscheidungen trifft, ist das in Ordnung. Bei der Neukonzeption („Was soll diese App überhaupt sein“) lässt der Nutzer Opus weiterhin von Grund auf planen.

Der Nutzer merkt an, dass dieses Muster „wahrscheinlich jedem klar ist, der sich die OpenRouter-Modellpreistabellen angesehen hat“, aber die Claude-Code-Subagent-Dokumentation ist zu diesem genauen Ansatz dünn.

📖 Vollständige Quelle lesen: r/ClaudeAI

Sparen Sie bei Claude Code-Rechnungen, indem Sie Planungs-Tokens an günstigere Modelle weiterleiten

Wie es funktioniert

Ergebnisse

Einschränkungen

👀 Siehe auch

Schreiben effektiver SOUL.md-Dateien für KI-Codierungsagenten

Automatisierung von Claude-Sitzungsneustarts mit tmux und at

Verwendung von Diktierwerkzeugen für effektivere KI-Agenten-Anweisungen

Verbesserungen der Eingabeaufforderungsstruktur für zuverlässige KI-Fähigkeitsausführung