Réduire de 80 % les coûts d'OpenClaw : changement de modèle

Un utilisateur de Reddit a passé deux semaines à journaliser manuellement chaque interaction avec l'agent OpenClaw pour comprendre où allait son argent. Les résultats offrent un plan clair pour optimiser les dépenses sur les agents IA.

La répartition

Sur 14 jours avec un agent Telegram + Discord, l'utilisation des tokens se décompose comme suit :

Heartbeats (sondages toutes les 30 min) — 38% de l'utilisation. Exécutés sur Opus à environ 6,75 $/M tokens. Un gaspillage complet pour une simple vérification de statut.
Lectures et résumés de fichiers — 29% de l'utilisation. Également sur Opus. Flash les traite à l'identique.
Conversations réelles — 22% de l'utilisation. Ici, la qualité du modèle compte.
Tâches complexes — 11% de l'utilisation. Là où Opus surpasse vraiment Flash.

Au total, 67% des dépenses concernaient des tâches où DeepSeek V4 Flash (0,14 $/M) offrirait une qualité identique à Opus (6,75 $/M effectif après tokenizer).

La solution : Flash par défaut, escalade seulement quand nécessaire

Définissez votre modèle principal sur deepseek/deepseek-v4-flash dans openclaw.json :

"agents": {
  "defaults": {
    "model": {
      "primary": "deepseek/deepseek-v4-flash"
    }
  }
}

Utilisez ensuite /model anthropic/claude-opus-4-7 en cours de session lorsque vous rencontrez quelque chose de vraiment difficile. Le changement est instantané — pas de redémarrage, même session. Tapez /model deepseek/deepseek-v4-flash lorsque vous avez terminé pour revenir au modèle bon marché.

Résultats

Les coûts sont passés d'environ 170 $/mois à environ 35 $/mois. La différence de qualité sur les heartbeats, les lectures de fichiers et les questions simples était littéralement nulle.

L'utilisateur note que le niveau gratuit de BetterClaw (avec BYOK) affiche désormais les dépenses API par tâche, ce qui aurait immédiatement révélé le gaspillage des heartbeats. Mais la décision centrale — passer à Flash par défaut et utiliser /model pour passer à Opus uniquement lorsque nécessaire — est le véritable enseignement.

📖 Lire la source complète : r/openclaw

Comment réduire de 80 % les coûts de l'agent OpenClaw grâce au changement de modèle

La répartition

La solution : Flash par défaut, escalade seulement quand nécessaire

Résultats

👀 See Also

Les utilisateurs de Claude IA obtiennent de meilleurs résultats en fournissant du contexte plutôt que des instructions génériques.

Claude Code Mode sans interface avec l'indicateur --print

7 bugs de la passerelle MCP : fuites de session, SSE mort et OAuth en mode passerelle

Telegram vs Discord vs WhatsApp : Choisir votre canal OpenClaw