Comment réduire de 80 % les coûts de l'agent OpenClaw grâce au changement de modèle

Un utilisateur de Reddit a passé deux semaines à journaliser manuellement chaque interaction avec l'agent OpenClaw pour comprendre où allait son argent. Les résultats offrent un plan clair pour optimiser les dépenses sur les agents IA.
La répartition
Sur 14 jours avec un agent Telegram + Discord, l'utilisation des tokens se décompose comme suit :
- Heartbeats (sondages toutes les 30 min) — 38% de l'utilisation. Exécutés sur Opus à environ 6,75 $/M tokens. Un gaspillage complet pour une simple vérification de statut.
- Lectures et résumés de fichiers — 29% de l'utilisation. Également sur Opus. Flash les traite à l'identique.
- Conversations réelles — 22% de l'utilisation. Ici, la qualité du modèle compte.
- Tâches complexes — 11% de l'utilisation. Là où Opus surpasse vraiment Flash.
Au total, 67% des dépenses concernaient des tâches où DeepSeek V4 Flash (0,14 $/M) offrirait une qualité identique à Opus (6,75 $/M effectif après tokenizer).
La solution : Flash par défaut, escalade seulement quand nécessaire
Définissez votre modèle principal sur deepseek/deepseek-v4-flash dans openclaw.json :
"agents": {
"defaults": {
"model": {
"primary": "deepseek/deepseek-v4-flash"
}
}
}Utilisez ensuite /model anthropic/claude-opus-4-7 en cours de session lorsque vous rencontrez quelque chose de vraiment difficile. Le changement est instantané — pas de redémarrage, même session. Tapez /model deepseek/deepseek-v4-flash lorsque vous avez terminé pour revenir au modèle bon marché.
Résultats
Les coûts sont passés d'environ 170 $/mois à environ 35 $/mois. La différence de qualité sur les heartbeats, les lectures de fichiers et les questions simples était littéralement nulle.
L'utilisateur note que le niveau gratuit de BetterClaw (avec BYOK) affiche désormais les dépenses API par tâche, ce qui aurait immédiatement révélé le gaspillage des heartbeats. Mais la décision centrale — passer à Flash par défaut et utiliser /model pour passer à Opus uniquement lorsque nécessaire — est le véritable enseignement.
📖 Lire la source complète : r/openclaw
👀 See Also

La tendance de Claude Code à valider des hypomèses erronées et à suggérer des contournements
Un développeur rapporte que Claude Code mettra en œuvre avec enthousiasme des architectures défectueuses sans remettre en question des hypothèses incorrectes, ce qui entraîne une perte de temps de débogage. La solution consiste à ajouter explicitement « suppose que je puisse me tromper sur le cadrage » aux demandes complexes.

Comment réparer les approximations CSS de Claude Code avec un système de design
Un développeur a constaté que Claude Code régénère sans cesse du HTML/CSS mal aligné car il conçoit à l'aveugle sans retour visuel. La solution : fournir un système de design complet avec des variables d'espacement, de couleurs et de typographie, puis séparer les instructions HTML et CSS.

Solution de contournement pour Firefox pour le problème de gel de Claude.ai utilisant un script Tampermonkey
Un utilisateur de Reddit partage un contournement utilisant un script Tampermonkey pour les utilisateurs de Firefox qui rencontrent des blocages sur Claude.ai. Le script modifie le comportement de Date.now() pour éviter les conflits de temporisation qui provoquent le gel de l'interface.

Après 3 mois de tests A/B de 160 codes de prompt Claude : les conclusions ennuyeuses
Samarth a construit un banc d'essai contrôlé, y a exécuté 160 codes d'invite, et a découvert que la plupart sont un placebo, 7 modifient systématiquement le raisonnement, et empiler 3 codes ou plus perturbe le modèle. Les fichiers de compétences surpassent les codes d'invite pour Claude Code.