Analyse de Claude Opus 4.7 : Intelligence de pointe, mais coût élevé et verbosité

Analyse des Performances de Claude Opus 4.7
Artificial Analysis a publié des données détaillées sur l'intelligence, les performances et les tarifs de Claude Opus 4.7 (Raisonnement Adaptatif, Effort Maximum). Ce modèle propriétaire d'Anthropic a été publié en avril 2026 et prend en charge l'entrée de texte et d'images avec une sortie de texte.
Métriques Clés et Classements
- Intelligence : n°1/133 modèles avec un score de 57 sur l'Indice d'Intelligence Artificial Analysis (la moyenne est de 31)
- Vitesse : n°71/133 modèles à 50 tokens de sortie par seconde (la moyenne est de 61)
- Prix d'Entrée : n°116/133 modèles à 5,00 $ USD par million de tokens (la moyenne est de 1,40 $)
- Prix de Sortie : n°117/133 modèles à 25,00 $ USD par million de tokens (la moyenne est de 8,40 $)
- Verbiage : n°96/133 modèles, générant 100 millions de tokens lors de l'évaluation (la moyenne est de 35 millions)
Spécifications Techniques
- Modèle de raisonnement (l'icône d'ampoule indique la capacité de raisonnement)
- Fenêtre de contexte d'un million de tokens (~1500 pages A4 en police Arial taille 12)
- Limite de connaissances : 1er janvier 2026
- Coût d'évaluation : 4406,45 $ pour exécuter sur l'Indice d'Intelligence
Contexte de Comparaison
Le modèle est comparé à 133 modèles de sa catégorie. Les modèles propriétaires comme Claude Opus 4.7 sont comparés aux modèles propriétaires et aux modèles à poids ouverts de la même gamme de prix en utilisant un ratio de prix entrée/sortie mixte de 3:1. L'Indice d'Intelligence Artificial Analysis v4.0 intègre 10 évaluations : GDPval-AA, τ²-Bench Telecom, Terminal-Bench Hard, SciCode, AA-LCR, AA-Omniscience, IFBench, Humanity's Last Exam, GPQA Diamond et CritPt.
L'analyse conclut que Claude Opus 4.7 fait partie des modèles leaders en intelligence, mais est particulièrement coûteux par rapport aux autres modèles de prix similaire. Il est également plus lent que la moyenne et très verbeux dans ses sorties.
📖 Read the full source: HN AI Agents
👀 See Also

L'agent IA Coasty résout les défis CAPTCHA jusqu'au niveau 6 sans entraînement.
L'agent d'utilisation informatique de Coasty (CUA) a obtenu 82 % sur le benchmark OSWorld, résolvant des CAPTCHA jusqu'au niveau 6, des popups de navigateur et des bannières de cookies sans entraînement spécifique pour les défis 'Je ne suis pas un robot'.

OpenClaw 2026.3.28 : Changements majeurs pour les utilisateurs de MiniMax, suppression de la réparation automatique de la configuration
OpenClaw 2026.3.28 supprime la réparation automatique des clés de configuration obsolètes et élimine plusieurs modèles MiniMax. Les utilisateurs doivent mettre à jour leurs configurations avant la mise à niveau pour éviter les échecs de démarrage de la passerelle.

Claude Opus 4.5 et Sonnet 4.5 retirés de la sélection de modèles, nécessitent un indicateur de lancement.
Claude Opus 4.5 et Sonnet 4.5 ne sont plus disponibles dans le menu de sélection /model pendant les sessions. Les utilisateurs doivent désormais démarrer les sessions avec le drapeau --model en spécifiant l'identifiant complet du modèle pour accéder à ces versions antérieures.

Meta suit les interactions des employés sur ordinateur pour la formation d'agents IA.
Meta installe un logiciel de suivi sur les ordinateurs de ses employés américains pour capturer les mouvements de souris, les clics et les frappes au clavier afin d'entraîner des modèles d'IA capables d'effectuer des tâches de travail de manière autonome. L'outil fonctionne sur les applications et sites web liés au travail et prend occasionnellement des captures d'écran pour le contexte.