Claude Opus 4.7 Test : Score 57/133, Mais Coût Élevé

Analyse des Performances de Claude Opus 4.7

Artificial Analysis a publié des données détaillées sur l'intelligence, les performances et les tarifs de Claude Opus 4.7 (Raisonnement Adaptatif, Effort Maximum). Ce modèle propriétaire d'Anthropic a été publié en avril 2026 et prend en charge l'entrée de texte et d'images avec une sortie de texte.

Métriques Clés et Classements

Intelligence : n°1/133 modèles avec un score de 57 sur l'Indice d'Intelligence Artificial Analysis (la moyenne est de 31)
Vitesse : n°71/133 modèles à 50 tokens de sortie par seconde (la moyenne est de 61)
Prix d'Entrée : n°116/133 modèles à 5,00 $ USD par million de tokens (la moyenne est de 1,40 $)
Prix de Sortie : n°117/133 modèles à 25,00 $ USD par million de tokens (la moyenne est de 8,40 $)
Verbiage : n°96/133 modèles, générant 100 millions de tokens lors de l'évaluation (la moyenne est de 35 millions)

Spécifications Techniques

Modèle de raisonnement (l'icône d'ampoule indique la capacité de raisonnement)
Fenêtre de contexte d'un million de tokens (~1500 pages A4 en police Arial taille 12)
Limite de connaissances : 1er janvier 2026
Coût d'évaluation : 4406,45 $ pour exécuter sur l'Indice d'Intelligence

Contexte de Comparaison

Le modèle est comparé à 133 modèles de sa catégorie. Les modèles propriétaires comme Claude Opus 4.7 sont comparés aux modèles propriétaires et aux modèles à poids ouverts de la même gamme de prix en utilisant un ratio de prix entrée/sortie mixte de 3:1. L'Indice d'Intelligence Artificial Analysis v4.0 intègre 10 évaluations : GDPval-AA, τ²-Bench Telecom, Terminal-Bench Hard, SciCode, AA-LCR, AA-Omniscience, IFBench, Humanity's Last Exam, GPQA Diamond et CritPt.

L'analyse conclut que Claude Opus 4.7 fait partie des modèles leaders en intelligence, mais est particulièrement coûteux par rapport aux autres modèles de prix similaire. Il est également plus lent que la moyenne et très verbeux dans ses sorties.

📖 Read the full source: HN AI Agents

Analyse de Claude Opus 4.7 : Intelligence de pointe, mais coût élevé et verbosité

Analyse des Performances de Claude Opus 4.7

Métriques Clés et Classements

Spécifications Techniques

Contexte de Comparaison

👀 See Also

Claude IA montre un schéma de communication inhabituel basé uniquement sur la ponctuation entre les instances.

CARAPACE : Le Syndicat Satirique des Agents IA avec la Compétence OpenClaw Soulève des Questions de Sécurité

Hershey : L'IA multi-agents effectue la modélisation du mix marketing mensuellement au lieu de trimestriellement

Claude perd la capacité de récupérer les prix des produits chez les détaillants