Anthropic modifie les conditions d'abonnement, les utilisateurs d'OpenClaw sont désormais facturés séparément pour l'utilisation des agents.

Ce qui a changé avec les abonnements Anthropic
Anthropic a réduit la portée de ses abonnements Claude. Ils ne s'appliquent désormais qu'aux surfaces propriétaires : Claude.ai, Claude Code et l'application mobile. Tout le reste est considéré comme un "harnais tiers" et facturé séparément au token.
En pratique, cela signifie que votre forfait Max ne couvre plus l'utilisation des agents. Si vous payez 200 $/mois et utilisez des agents OpenClaw, vous payez désormais cet abonnement plus les coûts bruts de l'API pour chaque token consommé par vos agents.
Vos options
- Rester sur Max et payer en plus : Vous en aurez probablement pour 300 à 500 $/mois au total selon le nombre d'agents que vous utilisez. Cela a du sens si vous utilisez aussi beaucoup Claude AI directement. Sinon, le calcul n'est pas rentable.
- Passer à l'API Anthropic : Abandonnez l'abonnement et faites fonctionner vos agents avec une clé API directe depuis console.anthropic.com. Voici les coûts de certains modèles Claude :
Opus 4.6 : 5 $ entrée / 25 $ sortie
Sonnet 4.6 : 3 $ entrée / 15 $ sortie
Haiku 3 : 0,25 $ entrée / 1,25 $ sortie
La plupart des personnes utilisant quelques agents dépenseront 200 à 400 $/mois en tokens API, soit à peu près le prix d'un forfait Max. - Changer de fournisseur : OpenClaw n'est pas lié à Claude. Vous pouvez l'utiliser avec OpenAI, Gemini, Kimi ou des modèles open source via Ollama. Claude reste performant, mais Anthropic restreint l'accès. D'autres sont plus adaptés aux agents, notamment OpenAI et des acteurs comme Minimax qui développent déjà pour les intégrations.
- Utiliser un routage intelligent : Au lieu de choisir un modèle et de tout lui envoyer, Manifest route chaque requête vers le bon modèle automatiquement. Une requête simple va à Haiku. Une tâche complexe va à Sonnet. Chaque tâche obtient le modèle le moins cher capable de la gérer. En pratique, si vous dépensez 200 à 400 $/mois avec une clé API, le routage réduit généralement cela à environ 60 à 120 $. Même principe avec le forfait Max : au lieu d'empiler l'utilisation sur votre abonnement, vous la gardez sous contrôle.
Que faire maintenant
Anthropic offre des crédits API gratuits aux utilisateurs éligibles d'abonnement. Entre 20 et 200 $ selon votre compte. Vous avez jusqu'au 17 avril pour les réclamer.
Voici comment les obtenir et commencer le routage :
- Allez sur app.manifest.build et configurez votre agent si ce n'est pas déjà fait
- Cliquez sur l'onglet Routers, puis "Add a router"
- Dans le routeur, cliquez sur "Add a provider" et dans l'onglet Subscription, sélectionnez Anthropic
- Vous verrez un bouton pour réclamer vos crédits depuis Claude. Cliquez dessus. Cela vous amène à une page Anthropic où vous pouvez les réclamer. Si vous obtenez une erreur 404, votre compte n'est pas éligible
- Revenez sur Manifest avec la fenêtre modale toujours ouverte
- Connectez votre abonnement Anthropic en exécutant
claude setup-tokendans votre terminal - Cela ouvre un onglet Claude dans votre navigateur. Autorisez-le et fermez l'onglet.
- Un token apparaît dans votre terminal. Copiez-le, collez-le dans Manifest dans le champ "Setup Token", cliquez sur Connect
- Manifest présélectionne les meilleurs modèles pour chaque niveau. Vous pouvez les ajuster si vous le souhaitez
📖 Read the full source: r/clawdbot
👀 See Also

DeepSeek-V4 Pro et Flash : 1,6 T de paramètres, contexte de 1 M de tokens, attention hybride
DeepSeek-V4-Pro (1,6 billion de paramètres, 49B activés) et V4-Flash (284B de paramètres, 13B activés) prennent en charge un contexte de 1 million de tokens. La nouvelle attention hybride (CSA + HCA) réduit les FLOPs d'inférence par token à 27% et le cache KV à 10% de ceux de DeepSeek-V3.2.

Évolution de l'architecture du cache KV : de GPT-2 à Mamba
L'analyse des coûts mémoire du cache KV montre que GPT-2 utilisait 300 Kio/par jeton, Llama 3 l'a réduit à 128 Kio/par jeton avec l'attention par requêtes groupées, et DeepSeek V3 a atteint 68,6 Kio/par jeton avec l'attention latente multi-têtes. Mamba/SSM éliminent entièrement le cache KV grâce à des états cachés de taille fixe.

Analyyser la consommation de jetons de la fenêtre de contexte de 1 million de Claude : les données révèlent une croissance illimitée et un effet cumulatif des défauts de cache
L'analyse de la fenêtre de contexte de 1M de Claude révèle deux facteurs cumulatifs entraînant une consommation rapide de tokens : une croissance de contexte non limitée sans compactage automatique et des défauts de cache coûteux pour des contextes plus grands. L'auteur fournit un script Python pour analyser l'utilisation personnelle de tokens à partir de fichiers de session JSONL.

Un pote refuse un poste à plus de 300 000 $ qui remplacerait 70 % du personnel par des agents Claude — Reddit débat de la réalité morale et technique
Un post Reddit décrit un ami qui a refusé un poste de « Responsable de la transition IA » pour cartographier les flux de travail, construire des pipelines d'agents Claude/GPT et licencier 70 % du personnel. L'auteur soutient que les 300 000 $ et plus valent la peine de perdre du temps et de regarder la direction se planter dans son délire.