Claude vs GPT-4o : Différence d'interprétation du double pendule

Un utilisateur de Reddit a exécuté le même prompt de double pendule avec Claude et GPT-4o côte à côte en utilisant un moteur de rendu hôte partagé et a observé deux systèmes physiques complètement différents en quelques secondes. La cause : chaque modèle a choisi une convention différente pour mesurer thêta.

Claude a mesuré theta à partir de la verticale haute (theta=0 = bras pointant vers le haut), tandis que GPT-4o mesurait à partir de la verticale basse (theta=0 = bras pendant vers le bas). Le moteur de rendu hôte dans public/workers/simulator-host.js lit simplement info.theta1 et info.theta2 et dessine les bras en conséquence — aucune différence cosmétique. Ainsi, le décalage visuel est un véritable décalage physique.

Les deux conventions sont techniquement valides. La plupart des manuels de mécanique classique utilisent thêta à partir de la verticale basse car cela rend le point d'équilibre à theta=0 pour les approximations des petits angles. Mais thêta à partir de la verticale haute est également standard dans de nombreuses références. Claude a respecté sa convention de manière cohérente dans les équations du mouvement, les conditions initiales et l'intégration (Runge Kutta). GPT-4o a utilisé l'autre convention silencieusement — il n'a pas commenté son choix.

L'utilisateur travaillait sur Physics Bench, un benchmark open-source côte à côte où chaque modèle reçoit le même contrat de génération : function createSimulator(...) dans lib/prompt.ts. L'hôte possède tout le rendu ; les modèles implémentent seulement step, getInfo et reset. Les modèles ne touchent jamais à draw. Ainsi, toute différence visuelle entre les panneaux est garantie de provenir d'une réelle différence dans la logique de simulation, et non de choix de rendu.

Un test unitaire des calculs n'aurait pas détecté cela. Les deux modèles produisent une physique correcte pour leurs conventions choisies. Vous ne voyez la divergence que lorsque vous les affichez côte à côte via le même code de dessin. Cela souligne l'importance de spécifier explicitement les conventions de coordonnées dans les prompts lorsque la sortie est consommée par un moteur de rendu fixe.

Voir le fil Reddit complet pour les extraits de code et les détails de l'inspecteur de conversation.

📖 Lire la source complète : r/ClaudeAI

Claude contre GPT-4o : Même consigne pour double pendule, conventions de coordonnées différentes

👀 See Also

Accès à l'IA de pointe restreint : le Mythe d'Anthropic et le virage structurel vers des déploiements sélectifs

Le développeur de Claude Code reconnaît une faille dans la pensée adaptative et propose une solution de contournement.

Mise à jour du classement SWE-rebench : les résultats de février 2026 révèlent une compétition serrée

Les NPU IA AMD Ryzen bénéficient d'une prise en charge Linux LLM via Lemonade 10.0 et FastFlowLM