Optimisation des coûts d'OpenClaw : comment un développeur a corrigé une erreur de 750 $ grâce au routage de modèles

Ce qui n'a pas fonctionné avec la correction des coûts
Après avoir dépensé 750 $ en 3 jours sur OpenRouter, le développeur a initialement « corrigé » les coûts en remplaçant tout par Hunter Alpha (gratuit sur OpenRouter). Cela a entraîné que les sous-agents ne retournent aucune sortie — des complétions silencieuses où les tâches affichaient « succès » mais les résultats étaient vides.
Un cas d'échec spécifique : un agent de production vidéo a écrit un code dont la syntaxe était correcte, qui s'est exécuté sans erreur, mais qui a produit une vidéo noire et silencieuse de 9 secondes sans voix off, sans séquences vidéo et sans manifeste. L'assurance qualité l'a finalement détecté. La leçon : les modèles gratuits n'échouent pas toujours bruyamment — parfois, ils livrent discrètement un brouillon et passent à autre chose.
La nouvelle stratégie de routage des modèles
Le développeur a cessé de penser « bon marché contre cher » et a commencé à réfléchir « de quoi cette tâche a-t-elle réellement besoin » :
- Session principale (orchestration) : Sonnet 4.6 — « Le manager. Le coût en vaut la peine. »
- Tâches de code/complexes : Gemini 2.5 Flash à 0,15 $/M — « Le point idéal pour une réelle production. »
- Données sensibles (identifiants, informations financières) : Claude 3.5 Haiku — « Anthropic ne journalise pas les invites. Non négociable. »
- Tâches simples et prévisibles : Hunter Alpha — « Acceptable lorsque l'échec est évident et que les enjeux sont faibles. »
Chaque tâche cron et chaque lancement de sous-agent dispose désormais d'un paramètre de modèle explicite — pas de valeurs par défaut.
Découverte de sécurité lors de l'audit
En enquêtant sur les problèmes de modèles, le développeur a découvert des identifiants commités dans son dépôt de l'espace de travail — des clés API et des jetons OAuth. Bien que non poussés publiquement, cela était inacceptable. Ils ont ajouté un .gitignore pour credentials/ et ont exécuté git rm --cached. L'avertissement : si vous avez déjà commité un dossier d'identifiants, ces clés restent dans votre historique git — changez-les.
La leçon principale
L'optimisation des coûts n'est pas un changement de configuration ponctuel. Un modèle à 0,15 $/M qui écrit votre pipeline de production est de l'argent bien dépensé. Un modèle gratuit qui vous passe discrètement une vidéo défectueuse est coûteux, quel que soit son coût par token. Adaptez le modèle à la tâche et vérifiez la sortie, pas seulement les codes de sortie.
📖 Read the full source: r/openclaw
👀 See Also

Freelance non-technique utilise MaxClaw et MiniMax Agent pour élargir ses services.
Un stratège en médias sociaux sans compétences en codage utilise MiniMax Agent pour créer des pages de destination et MaxClaw pour gérer les briefs clients et la recherche de contenu, augmentant ainsi ses tarifs de projet de 1 500 $ à 3 200 $.

Comment un développeur a corrigé 16 faiblesses architecturales dans son système d'agent IA
Un développeur a documenté 16 problèmes architecturaux dans son système d'agent IA OpenClaw et a mis en œuvre des correctifs spécifiques incluant des définitions explicites de couches, une autorisation par passerelle et une exécution basée sur des preuves.

Étude de cas OpenClaw : Gestion d'une boîte de réception d'e-mails pendant 10 jours sans intervention humaine
Un consultant indépendant a donné à OpenClaw un accès complet à son Gmail pendant 10 jours lors d'un voyage, avec pour instructions de répondre dans son ton exact, de signaler uniquement les éléments critiques et de gérer les tâches de routine de manière autonome. Le système a traité 187 courriels avec une seule erreur mineure.

RAG Hybride pour la Mémoire d'Agent Local avec OpenClaw, Ollama et nomic-embed-text
Un développeur a mis en œuvre une récupération hybride RAG pour la mémoire des agents IA en utilisant OpenClaw avec Ollama et nomic-embed-text, combinant 70% de similarité vectorielle avec 30% de correspondance par mots-clés BM25. La configuration fonctionne localement sans API externes et inclut une déduplication MMR et une pondération par décroissance temporelle.