Claude Opus 4.8 publié : mode rapide plus rapide et moins cher, workflows dynamiques et améliorations de l'honnêteté

Anthropic a publié aujourd'hui Claude Opus 4.8, une mise à jour d'Opus 4.7 avec des améliorations de performance dans le codage, les compétences agentiques, le raisonnement et le travail cognitif. La nouvelle version est disponible au même prix que le modèle précédent.
Fonctionnalités clés
- Contrôle de l'effort sur claude.ai — les utilisateurs peuvent désormais définir le niveau d'effort que Claude consacre à une tâche.
- Workflows dynamiques dans Claude Code — permet au modèle de traiter des problèmes à très grande échelle.
- Mode rapide fonctionne à une vitesse 2,5× et est désormais trois fois moins cher que le mode rapide des modèles précédents.
Points forts des benchmarks
Selon l'annonce, Claude Opus 4.8 est le seul modèle à terminer chaque cas de bout en bout sur le benchmark Super-Agent d'Anthropic, surpassant les modèles Opus précédents et GPT-5.5 à coût égal. Sur Online-Mind2Web (tâches d'utilisation d'ordinateur et d'agent navigateur), il a obtenu 84 % — une progression significative par rapport à Opus 4.7 et GPT-5.5. Sur CursorBench, il dépasse les modèles Opus précédents à tous les niveaux d'effort.
Sur le Legal Agent Benchmark, Opus 4.8 est le premier modèle à franchir la barre des 10 % au total sur le critère de réussite totale. Les premiers testeurs ont également signalé des améliorations dans l'efficacité des appels d'outils (moins d'étapes pour la même intelligence), la précision des citations et l'efficacité des jetons dans les workflows de récupération.
Entraînement à l'honnêteté
Opus 4.8 introduit des améliorations explicites de l'honnêteté — le modèle est entraîné à éviter les affirmations non fondées et à signaler proactivement les problèmes liés aux entrées/sorties. Cela s'est traduit par des analyses de meilleure qualité et un meilleur rapport signal/bruit dans les évaluations des testeurs.
Tarification
Opus 4.8 est disponible au même prix qu'Opus 4.7. Le prix du mode rapide est 3× moins cher que celui du mode rapide précédent. Le coût des jetons multimodaux est 61 % moins cher qu'Opus 4.7 pour Genie (l'agent IA de Databricks).
📖 Lire la source complète : HN AI Agents
👀 See Also

La fuite du code source de Claude révèle des fonctions anti-distillation, un mode infiltré et une détection de frustration
Un fichier source map divulgué du package npm Claude Code révèle des techniques anti-distillation utilisant de faux outils, un mode discret qui masque la paternité IA, et une détection de frustration via des motifs regex.

Anthropic restreint l'utilisation des abonnements Claude sur des outils tiers comme OpenClaw.
Anthropic modifie sa politique d'abonnement à Claude pour bloquer l'utilisation sur des interfaces tierces, y compris OpenClaw, exigeant une facturation séparée au paiement à l'utilisation pour ces outils à partir du 4 avril. L'entreprise propose un crédit unique équivalent au prix de l'abonnement mensuel et des remises allant jusqu'à 30 % pour les achats anticipés.

Google : 75 % du nouveau code est généré par l'IA, la migration de code 6 fois plus rapide avec les agents.
Google rapporte que 75 % du nouveau code est généré par IA, contre 25 % en 2024. Une migration de code complexe a été réalisée 6 fois plus vite à l'aide des agents Gemini. Dans certains départements, les ingénieurs ont des objectifs d'utilisation de l'IA liés aux évaluations de performance.

Trois lois inverses de la robotique : Directives humaines pour l'utilisation de l'IA
Susam Pal propose trois lois inverses de la robotique pour les humains : ne pas anthropomorphiser l'IA, ne pas faire aveuglément confiance à ses résultats et rester pleinement responsable. Des avertissements pratiques contre une dépendance excessive à l'IA générative.