Opus 4.6 Échoue aux Diagrammes de Physique : Solution

Problème de performance avec le mode de réflexion étendue

Un utilisateur sur r/ClaudeAI a rapporté avoir testé Opus 4.6 et Gemini 3.1 Pro sur des problèmes de physique nécessitant l'interprétation de diagrammes visuels. Les tests ont révélé une régression de performance spécifique chez Opus 4.6 lors de l'utilisation du mode de réflexion étendue.

Principales conclusions des tests

Portée des tests : 5 problèmes de physique où « une grande partie du problème consiste à interpréter des diagrammes visuels présentant des scénarios »
Opus 4.6 avec réflexion étendue : A échoué sur les 5 problèmes « complètement à cause d'une mauvaise interprétation fondamentale du diagramme »
Gemini 3.1 Pro : A « réussi haut la main » les 5 problèmes
Opus 4.6 sans réflexion étendue : A résolu les problèmes avec succès et était « bien plus rapide aussi »

L'utilisateur a décrit cela comme un « comportement vraiment étrange » puisque la réflexion étendue améliore généralement les performances, mais dans ce cas spécifique d'interprétation de diagrammes, elle a provoqué des échecs systématiques.

📖 Read the full source: r/ClaudeAI

Opus 4.6 La Pensée Étendue obtient de moins bons résultats sur les problèmes de diagrammes de physique

Problème de performance avec le mode de réflexion étendue

Principales conclusions des tests

👀 See Also

Glomz Octagon : Révisions de code multi-agents – 179 agents, 1 333 révisions et l'effet de réseau

Anthropic retarde les modifications des limites de taux de l'API Claude Code

Le code source de Claude aurait fuité, révélant des détails sur l'architecture de l'agent

Panne généralisée de Claude AI : interface web indisponible, erreurs API en hausse