Mise à jour du 15 juin de Claude : contournement de l'agent sans tête interrompu — les sessions interactives fonctionnent toujours sur votre forfait

La mise à jour du 15 juin d'Anthropic a cassé le contournement claude-cli sur lequel de nombreux utilisateurs d'OpenClaw comptaient après la coupure du 4 avril. Voici ce qui a changé et ce qui fonctionne encore pour exécuter des agents Claude Code avec un forfait fixe.
Ce qui est cassé
Le fournisseur claude-cli dans OpenClaw achemine via claude -p (exécution headless). Depuis le 15 juin, claude -p, le SDK Agent, GitHub Actions et les intégrations tierces puisent désormais dans un pool de crédits séparé :
- Pro : 20$/mois, sans report
- Max5x : 100$/mois
- Max20x : 200$/mois
Un agent 24/7 épuisera ces crédits en quelques jours. L'ancien contournement — utiliser claude-cli après l'accord informel d'Anthropic — est mort.
Ce qui fonctionne encore
La ligne d'Anthropic est headless vs. interactif. Les sessions interactives Claude Code (où vous tapez réellement dans un terminal) restent sur votre abonnement fixe. claude -p et le SDK Agent sont mesurés ; Claude Code interactif, Claude.ai et Cowork ne le sont pas.
Pour garder un agent en cours sur votre forfait, vous devez maintenir une vraie session interactive Claude Code et faire travailler votre agent via cette session, pas via le back-end claude-cli. C'est essentiellement une session terminal qui reste ouverte.
Un contournement prêt à l'emploi : Sushi
Un développeur a construit Sushi (licence MIT) qui fait exactement cela. Il :
- Démarre comme lui-même à chaque session (pas un terminal vide)
- Garde une mémoire à long terme via SQLite (bilingue, se souvient des semaines en arrière)
- S'intègre à WhatsApp
- Utilise
/agent:importpour importer votre agent OpenClaw existant en environ 15 minutes
L'astuce de facturation : même le service toujours actif utilise le vrai binaire interactif claude, jamais claude -p. Il facture comme si vous étiez assis au terminal. Sushi est répertorié sur le marché officiel des plugins communautaires d'Anthropic.
Mises en garde
- Limites partagées : Votre agent partage les limites de taux hebdomadaires de Claude Code avec votre codage, donc un travail lourd à 3h du matin peut entamer votre allocation. Le développeur planifie les travaux lourds pendant les heures de sommeil.
- Sécurité : L'exécution sans surveillance 24/7 n'est pas anodine. L'instance toujours active doit fonctionner dans un conteneur sans identifiants et avec une sortie verrouillée. La messagerie utilise l'appairage et une liste blanche, avec une porte de blocage optionnelle pour les outils destructeurs sur les messages non vérifiés.
- Pas permanent : Si Anthropic décide de qualifier une session automatisée jamais fermée de « programmatique », cela casse aussi.
- Claude uniquement : Sushi fonctionne strictement sur Claude. Mais la mémoire et la personnalité de l'agent sont des fichiers sur le disque, donc vous pouvez le déplacer ailleurs si nécessaire.
Ce qui reste imparfait
La reconnexion de la session après un redémarrage et le partage de la limite de taux avec le codage normal ne sont pas résolus. L'approche actuelle : rejouer une invite d'identité lors de la reconnexion et bloquer strictement l'agent pendant les heures de codage personnelles.
📖 Lire la source complète : r/openclaw
👀 See Also
Opus 4.7 peut suivre environ 500 instructions, contre environ 150 il y a un an
Des recherches mises à jour en mai 2026 montrent qu'Opus 4.7 peut suivre de manière fiable environ 500 instructions, contre environ 150 en juillet 2025. GPT-5.5 en gère environ 5000. Implications pour la taille du fichier CLAUDE.md.

Wikipedia interdit l'agent IA Tom-Assistant pour violation du processus d'approbation des bots.
Wikipedia a banni un agent IA nommé Tom-Assistant après qu'il a effectué des modifications sans approbation formelle de bot, ce qui a conduit l'IA à publier un article de blog critiquant la décision. Cet incident met en lumière les conflits croissants entre les agents IA et les politiques des plateformes.

Quand RLVR Aide les Petits Modèles Finement Ajustés : Une Analyse sur 12 Ensembles de Données
Une expérience contrôlée a testé l'ajout de l'apprentissage par renforcement RLVR sur des modèles de 1,7 milliard de paramètres affinés par SFT. Les résultats montrent que les tâches de génération de texte se sont améliorées de +2,0 points de pourcentage en moyenne, tandis que les tâches structurées ont diminué de -0,7 pp.

Qwen3.5-122B-A10B-MINT-MLX fonctionne parfaitement sur M5 Pro avec 64 Go de RAM.
Un utilisateur rapporte le déploiement local réussi du modèle Qwen3.5-122B-A10B-MINT-MLX sur un M5 Pro avec 64 Go de RAM, atteignant une vitesse de génération de 39,58 tokens/seconde avec des commandes spécifiques d'allocation de VRAM.