Utilisateur OpenClaw rapporte 143 millions de jetons traités pour 94 dollars via OpenRouter.

Un utilisateur de Reddit a partagé des métriques de coût détaillées provenant de l'exécution de systèmes multi-agents OpenClaw, démontrant des économies significatives par rapport à l'utilisation directe de l'API avec les principaux fournisseurs.
Comparaison des coûts et détails de configuration
L'utilisateur a traité 143,0 millions de tokens pour un coût total de 94,16 $ en une seule journée tout en terminant trois phases d'un lancement de produit SaaS en sept phases. Cela se décompose à 0,000000658 $ par token, soit environ 0,66 $ par 1 million de tokens.
À titre de comparaison, l'utilisateur a fourni les tarifs directs typiques des principaux fournisseurs :
- Claude Sonnet (Anthropic) : environ 3 $ par 1M de tokens d'entrée et 15 $ par 1M de tokens de sortie
- GPT-4o (OpenAI) : environ 5 $ par 1M de tokens d'entrée et 15 $ par 1M de tokens de sortie
- Tarification plus ancienne de la classe GPT-4 : souvent 10 $+ mixte selon l'utilisation
L'utilisateur a noté que 143 millions de tokens via la tarification Claude Sonnet ou GPT-4 coûteraient généralement entre 400 $ et 1500 $+ selon le mélange entrée/sortie.
Optimisations de configuration pour réduire les coûts
L'utilisateur a identifié plusieurs paramètres de configuration qui réduisent considérablement les coûts dans OpenClaw :
- Acheminer via OpenRouter au lieu d'accéder directement aux API OpenAI ou Anthropic
- Utiliser le modèle de rotation automatique par défaut, tourné en fonction de l'agent et de la compétence
- Activer la compaction de contexte pour que les agents ne renvoient pas constamment des historiques massifs
- Limiter les agents simultanés pour éviter une utilisation parallèle incontrôlée des tokens
- Utiliser un modèle d'orchestrateur pour que les agents ne communiquent pas constamment avec le modèle inutilement
L'utilisateur exécutait des pipelines multi-agents de style OpenClaw avec des composants incluant un agent orchestrateur, un agent backend, un agent frontend, un agent QA, un agent d'architecture et un agent de données. Il a souligné que l'économie des tokens est très importante pour les SaaS d'IA, les frameworks d'agents, les systèmes de développement autonomes ou les pipelines de style OpenClaw, notant que "brûler 1000 $ par semaine en tokens contre 100 $ fait la différence entre un projet sympa et quelque chose qui peut réellement évoluer."
📖 Lire la source complète : r/openclaw
👀 See Also

SenseNova-U1-8B-MoT : Modèle Multimodal Natif Open Source avec Architecture NEO-Unify
SenseNova a publié SenseNova-U1-8B-MoT, un modèle multimodal natif qui élimine à la fois l'encodeur visuel et le VAE, en utilisant l'architecture NEO-Unify pour une compréhension, un raisonnement et une génération unifiés. Il excelle dans la conversion texte-infographie, l'édition d'images et la génération entrelacée texte-image.

Les joueurs de Go se soumettent à l'IA : comment la triche est devenue indétectable
Le billet LessWrong explique comment la triche par IA dans les tournois de Go est devenue endémique et quasi impossible à sanctionner, en prenant le cas de Carlo Metta, qui a utilisé Leela 0.11 et Leela Zero pour remporter 25 de ses 26 parties sur plusieurs saisons, ne perdant qu'une seule fois sous la surveillance d'une caméra.

Accord de calcul Anthropic-xAI : Au-delà des limites de Claude Code
Anthropic a signé un accord de 300 MW / 220 000 GPU avec son concurrent xAI. Cela signale un resserrement de l'offre de GPU et un partage structurel des ressources de calcul entre laboratoires, avec des implications pour la tarification de l'inférence et le routage multi-fournisseurs.

Claude Code v2.1.90 : Nouveaux cours interactifs, améliorations des performances et corrections de bugs
Claude Code v2.1.90 introduit les leçons interactives /powerup, ajoute la variable d'environnement CLAUDE_CODE_PLUGIN_KEEP_MARKETPLACE_ON_FAILURE pour une utilisation hors ligne, et comprend de multiples améliorations de performances ainsi que des corrections de bugs pour les outils, l'interface utilisateur et la sécurité.