Modèle Dispatcher : Réduisez vos coûts API Claude de 95%

Un développeur créant des agents IA a découvert une optimisation de coûts après avoir dépensé 40 $ en une heure sur des jetons de l'API Claude pour des tâches courantes comme déboguer du code, rédiger des PR, préparer des e-mails et faire des recherches. La solution exploite son abonnement Claude Max existant de 200 $/mois, qui inclut une utilisation illimitée de Claude Code CLI dans les limites de débit.

Le modèle de répartiteur

L'approche consiste à créer un agent IA léger qui agit comme un répartiteur. Cet agent lit les messages de l'utilisateur, décide de l'action à entreprendre et délègue les tâches lourdes à Claude Code CLI, qui s'exécute sur l'abonnement Max sans coût supplémentaire. Seule la fine couche d'orchestration reste sur l'API : "Que demande l'utilisateur ? Ok, délègue à Claude Code. Rapporte le résultat."

Les tâches qui peuvent être déléguées incluent :

Programmation
Rédaction marketing
Préparation d'e-mails
Prospection commerciale
Recherche
Rédaction de contenu
Analyse de données
Publications Reddit

Comparaison des coûts

API pure (Opus, utilisation intensive) : 800 à 2 000+ $/mois
Abonnement Max + modèle de répartiteur : 200 $/mois forfaitaire
Coût API pour la surcharge du répartiteur uniquement : ~5 à 15 $/mois
Total avec modèle de répartiteur : ~215 $/mois contre 1 000+ $/mois

Instructions de configuration

# 1. Installer Claude Code CLI npm install -g /claude-code 2. Se connecter à claude code avec l'abonnement Max 3. Configurer la délégation openclaw config set plugins.entries.acpx.enabled true openclaw config set plugins.entries.acpx.config.permissionMode approve-all openclaw config set acp.enabled true openclaw config set acp.defaultAgent claude openclaw config set 'acp.allowedAgents' '["claude"]' --json 4. (Optionnel) Ajouter de l'observabilité

pip install clawmetry && clawmetry onboard

Le développeur a utilisé ClawMetry, un tableau de bord d'observabilité open source pour les agents OpenClaw, pour suivre l'utilisation des jetons par session, le coût par tâche et définir des alertes pour les seuils de dépenses d'API. L'outil a montré une réduction spectaculaire des coûts après la mise en œuvre du modèle de répartiteur, la plupart des dépenses précédentes étant allouées à des tâches que Claude Code gère via l'abonnement.

📖 Read the full source: r/openclaw