Route Claude Code Tokens to Cheaper Models: Save 40$

Un utilisateur de Reddit déclare avoir économisé environ 40 $ de frais de dépassement sur Claude Code le mois dernier en répartissant l'utilisation des jetons entre les modèles. L'idée clé : les étapes de planification (notamment dans les refontes multi-fichiers) peuvent consommer jusqu'à 80 % du budget de jetons, mais la plupart des planifications n'ont pas besoin du modèle le plus cher.

Comment ça marche

Ils ont écrit un wrapper de 30 lignes qui achemine le travail initial de 'déterminer quoi changer' vers Haiku 3.5 — un modèle moins cher. Seules les modifications réelles et les prises de décision restent sur Opus ou Sonnet. La configuration a pris environ 2 heures, y compris pour déterminer quelles étapes valaient la peine d'être déléguées.

Résultats

Le dernier cycle s'est terminé avec un budget restant pour la première fois en 4 mois. L'utilisateur a évité l'attente habituelle de 2 jours pour la fenêtre de réinitialisation. Économies : environ 40 $ de frais de dépassement.

# Pseudo-code pour la logique du wrapper :
# 1. Envoyer l'invite de planification à haiku-3.5
# 2. Récupérer une liste de fichiers et de modifications
# 3. Transmettre le plan + l'instruction à opus/sonnet pour les modifications réelles

Limitations

La qualité de planification de Haiku est nettement moins bonne pour les décisions architecturales. Pour les workflows de refonte et de test où Opus reprend les vraies décisions de toute façon, cela convient. Pour la conception from scratch ('quelle devrait être cette appli'), l'utilisateur laisse encore Opus planifier à partir de zéro.

L'utilisateur note que ce modèle est 'probablement évident pour quiconque a regardé les tableaux de prix des modèles OpenRouter', mais la documentation des sous-agents Claude Code est légère sur cette approche précise.

📖 Lire la source complète : r/ClaudeAI

Économisez sur les factures de Claude Code en acheminant les jetons de planification vers des modèles moins chers

Comment ça marche

Résultats

Limitations

👀 See Also

Comment désactiver la fonction de verb spinner de Claude Code

Claude Code : Gestion du Contexte plutôt que l'Ingénierie de Prompt

Comment une commande /loop a brûlé 6 000 $ sur l'API Claude en une nuit

4 fichiers qui ont permis à Claude Code d'écrire du code de base de données de production sécurisé