Acheminer le trafic de l'API Claude pour contrôler les coûts suite au changement d'abonnement Max

Migration vers la facturation API et implications sur les coûts
Depuis midi heure du Pacifique, l'abonnement Max d'Anthropic ne couvre plus l'utilisation d'outils tiers comme OpenClaw. Tous les utilisateurs d'OpenClaw sont désormais sur la facturation API avec ces tarifs :
- Claude Opus 4.6 : 5 $ par million de tokens d'entrée, 25 $ par million de tokens de sortie
- Claude Sonnet 4.6 : 3 $ par million de tokens d'entrée, 15 $ par million de tokens de sortie
- Claude Haiku 4.5 : 1 $ par million de tokens d'entrée, 5 $ par million de tokens de sortie
Une session intensive d'OpenClaw sur Opus peut coûter 1 à 4 $, tandis que la même session sur Sonnet coûte 0,20 à 0,80 $ avec des résultats similaires pour la plupart des tâches.
La solution de routage
La plupart des opérations d'OpenClaw ne nécessitent pas Opus : les vérifications de pulsation, les lectures de fichiers, les résumés, les décisions de routage et les appels d'outils courts peuvent tous être gérés par Sonnet. Sans couche de routage, chaque requête atteint votre modèle par défaut, gaspillant potentiellement le budget Opus sur des tâches simples.
Un proxy local route les requêtes Claude par complexité : les tâches simples vont automatiquement vers Sonnet, les tâches complexes sont escaladées vers Opus. Cette approche a significativement réduit les coûts sans perte de qualité sur les tâches importantes.
Le proxy est open source et installable via npm : npm install -g @relayplane/proxy
Une documentation détaillée et des discussions sont disponibles sur r/ClaudeCode, où la solution a reçu 52 000 vues.
📖 Read the full source: r/openclaw
👀 See Also

Quatre compétences gratuites de Claude Code pour la clarté des prompts, les tutoriels et la chasse aux bogues
Quatre compétences Claude Code gratuites sous licence Apache 2.0, sans palier payant : prompter (réécriture de prompts), tutorial-creator (annotations de code commentées), bug-echo (analyse post-correction des anti-patrons) et bug-prospector (audit pré-release avec 7 lentilles d'analyse).

CipherClaw : Utiliser un Personnage de Sécurité pour Auditer du Code avec Claude
Un développeur a utilisé CipherClaw, un persona CLAUDE.md appelé TALON, pour faire penser Claude Code comme un architecte de sécurité. Son exécution sur une application Next.js a révélé 17 problèmes de sécurité, dont des vulnérabilités critiques comme des points de terminaison non authentifiés renvoyant des données d'administrateur et des jetons d'authentification codés en dur.

llmLibrarian : Moteur RAG local avec intégration MCP pour la recherche IA basée sur fichiers
llmLibrarian est un moteur RAG local qui expose la récupération via MCP, permettant aux agents IA comme Claude d'interroger des fichiers indexés. Il utilise des collections ChromaDB pour l'organisation, Ollama pour la synthèse, et garde tout sur l'appareil.

Claude Code Studio : Application de bureau open-source pour gérer plusieurs sessions de codage Claude
Claude Code Studio v0.9.3 est une application de bureau open-source qui fournit une interface multi-fenêtres pour gérer plusieurs sessions CLI Claude Code. Il résout les problèmes courants de flux de travail comme jongler avec les onglets de terminal, la persistance des sessions et la répétition des instructions.