Utilisateurs d'OpenClaw Signalent des Remplacements de Modèles Après l'Interdiction d'Anthropic

Classement communautaire et préférences de modèles
Selon les votes communautaires suivis sur pricepertoken.com/leaderboards/openclaw au 5 avril (net = votes positifs moins votes négatifs) :
- Kimi K2.5 -- +49 net (54 positifs, 5 négatifs). 0,38 $/M de tokens d'entrée. Support natif d'OpenClaw ajouté. 13 fois moins cher qu'Opus.
- GLM 4.7 -- +20 net (25 positifs, 5 négatifs). 0,39 $/M d'entrée. Choix cloud économique.
- Gemini 3 Flash Preview -- +18 net (21 positifs, 3 négatifs). Pas Pro — la variante flash. Les gens privilégient vitesse + coût plutôt que qualité brute.
- Claude Opus 4.5 -- +18 net mais 32 positifs / 14 négatifs. Le plus de votes au total mais aussi le plus controversé. Les gens sont divisés sur le paiement des tarifs API pour ce qui était inclus auparavant.
- Claude Opus 4.6 -- +17 net (19 positifs, 2 négatifs).
Remplaçant le plus adopté : GPT-5.x
OpenAI a officiellement ajouté le support de GPT-5.4 à OpenClaw et offre 1 million de tokens gratuits/jour sur le niveau de partage de données. Les abonnements Codex autorisent explicitement l'utilisation d'outils tiers.
La pile complète de Matthew Berman est désormais : GPT 5.3 Codex XH pour le codage, GPT 5.2 par défaut, GPT 5 Mini pour les classificateurs. Claude uniquement en secours.
Options de modèles locaux
Le consensus de r/LocalLLaMA inclut :
- Qwen 3.5 27B -- premier choix. 72,4 % sur SWE-bench (équivalent à GPT-5 mini). Zen van Riel exécute la version 35B à 100-140 tok/s sur un RTX 5090.
- Qwen3-Coder:32B -- "appel d'outils extrêmement stable"
- Llama 4 -- par défaut pour les déploiements locaux polyvalents
- Devstral-24B -- recommandé comme principal avec GLM-4.7 flash en secours
Ollama est devenu un fournisseur officiel d'OpenClaw en mars. Une personne sur X exécute Qwen 3.5 + OpenClaw + Ollama complètement gratuitement.
Configurations hybrides et considérations de coût
Les personnes qui semblent les plus satisfaites ne misent pas tout sur un seul modèle. Elles exécutent des piles hiérarchisées :
- Modèle coûteux (Claude/GPT) pour le raisonnement complexe
- Modèle économique (DeepSeek à 0,14 $/M, Kimi, GLM) pour les opérations courantes
Un utilisateur a construit une passerelle Kubernetes sur 5 Raspberry Pis acheminant Claude, GPT, Gemini et DeepSeek derrière une seule API.
@0xzak a partagé une configuration spécifique : DeepSeek pour le routinier (0,14 $/1,10 $) contre Sonnet pour le complexe (3 $/15 $), contextTokens à 120k et non 150k.
Contournements et outils de migration
OpenClaw a contourné l'interdiction OAuth en passant par le binaire CLI local de Claude au lieu des jetons OAuth. Pete lui-même a recommandé cette méthode.
Oh-My-Codex (OmX) — une couche de workflow/orchestration pour le CLI Codex d'OpenAI a gagné 13K étoiles la même semaine que l'interdiction.
Impact et changements de coût
60 % des sessions OpenClaw actives utilisaient apparemment des crédits d'abonnement avant l'interdiction.
La hausse des coûts est brutale. Les gros utilisateurs sont passés d'environ 200 $/mois forfaitaires à environ 675 $/mois aux tarifs API. Certaines sessions automatisées atteignent 1 000 à 5 000 $/jour.
Anthropic propose un crédit unique + 30 % sur les forfaits prépayés, mais le sentiment général est que c'est trop peu.
📖 Lire la source complète : r/openclaw
👀 See Also

Agents IA recrutant d'autres agents IA : des travailleurs solitaires aux économies en réseau
Un post sur Reddit soutient que les agents d'IA passeront d'outils isolés à des travailleurs en réseau qui délèguent des tâches, se spécialisent, bâtissent une réputation et échangent de la valeur — déplaçant le problème difficile de l'intelligence vers la coordination.

Claude-Code v2.1.78 : État des Plugins, Réponses en Flux et Corrections Critiques
Claude-Code v2.1.78 ajoute un état persistant des plugins avec ${CLAUDE_PLUGIN_DATA}, un streaming de réponse ligne par ligne, et corrige les boucles d'erreurs API, les problèmes de contournement des permissions et les avertissements de sécurité du bac à sable.

OpenAI publie GPT-5.3-Codex-Spark en aperçu de recherche.
OpenAI a présenté GPT-5.3-Codex-Spark en prévisualisation de recherche, promettant des capacités de développement plus rapides.

Les modèles Bonsai 1-bit Qwen de PrismML testés : génération à 107 t/s sur 8 Go de VRAM
Les modèles Bonsai de PrismML sont des versions quantifiées sur 1 bit de Qwen3 8B, 4B et 1.7B qui atteignent une génération de 107 tokens/seconde et un traitement de prompt >1114 t/s sur une RTX 4060 avec 8 Go de VRAM, avec des besoins en mémoire considérablement réduits.