Opus 4.6 La Pensée Étendue obtient de moins bons résultats sur les problèmes de diagrammes de physique

✍️ OpenClawRadar📅 Publié: April 17, 2026🔗 Source
Opus 4.6 La Pensée Étendue obtient de moins bons résultats sur les problèmes de diagrammes de physique
Ad

Problème de performance avec le mode de réflexion étendue

Un utilisateur sur r/ClaudeAI a rapporté avoir testé Opus 4.6 et Gemini 3.1 Pro sur des problèmes de physique nécessitant l'interprétation de diagrammes visuels. Les tests ont révélé une régression de performance spécifique chez Opus 4.6 lors de l'utilisation du mode de réflexion étendue.

Principales conclusions des tests

  • Portée des tests : 5 problèmes de physique où « une grande partie du problème consiste à interpréter des diagrammes visuels présentant des scénarios »
  • Opus 4.6 avec réflexion étendue : A échoué sur les 5 problèmes « complètement à cause d'une mauvaise interprétation fondamentale du diagramme »
  • Gemini 3.1 Pro : A « réussi haut la main » les 5 problèmes
  • Opus 4.6 sans réflexion étendue : A résolu les problèmes avec succès et était « bien plus rapide aussi »

L'utilisateur a décrit cela comme un « comportement vraiment étrange » puisque la réflexion étendue améliore généralement les performances, mais dans ce cas spécifique d'interprétation de diagrammes, elle a provoqué des échecs systématiques.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also