Comparaison de référence de Qwen3.6 Plus avec les modèles SOTA occidentaux

✍️ OpenClawRadar📅 Publié: April 5, 2026🔗 Source

Un post Reddit sur r/LocalLLaMA compare Qwen3.6 Plus à plusieurs modèles occidentaux de pointe à travers plusieurs benchmarks. La comparaison inclut des métriques de performance spécifiques pour chaque modèle.

Résultats des Benchmarks

La source fournit ces scores exacts :

Qwen3.6-Plus : SWE-bench Verified 78,8, GPQA / GPQA Diamond 90,4, HLE (sans outils) 28,8, MMMU-Pro 78,8
GPT‑5.4 (xhigh) : SWE-bench Verified 78,2, GPQA / GPQA Diamond 93,0, HLE (sans outils) 39,8, MMMU-Pro 81,2
Claude Opus 4.6 (thinking heavy) : SWE-bench Verified 80,8, GPQA / GPQA Diamond 91,3, HLE (sans outils) 34,44, MMMU-Pro 77,3
Gemini 3.1 Pro Preview : SWE-bench Verified 80,6, GPQA / GPQA Diamond 94,3, HLE (sans outils) 44,7, MMMU-Pro 80,5

Le post inclut un graphique de comparaison visuel disponible à l'adresse : https://preview.redd.it/6kq4tt07yrsg1.png?width=714&format=png&auto=webp&s=ad8b207fb13729ae84f5b74cec5fd84a81dcface

Évaluation de l'Utilisateur

L'auteur original du post note que Qwen3.6 Plus est "compétitif mais pas le meilleur" et déclare : "Ce sera mon nouveau modèle étant donné son faible coût, mais sa réelle efficacité dépendra de plus que des benchmarks." Il observe également que "Opus surpasse tous les autres malgré sa 3e ou 4e place sur artificalanalysis."

📖 Lire la source complète : r/LocalLLaMA

👀 See Also

News

Claude contre GPT-4o : Même consigne pour double pendule, conventions de coordonnées différentes

Claude et GPT-4o produisent des simulations de double pendule visuellement différentes car ils interprètent thêta à partir de verticales opposées — haut contre bas — tout en utilisant le même moteur de rendu. Les calculs sont corrects dans les deux cas, mais le décalage révèle une ambiguïté subtile dans l'interprétation du prompt.

May 16, 2026, 04:16 PM UTC

OpenClawRadar

News

Apple construit une nouvelle architecture d'IA sur les modèles de fondation Google Gemini

Apple a annoncé une refonte majeure d'Apple Intelligence, basée sur des modèles fondateurs co-développés avec Google utilisant la technologie Gemini. La nouvelle architecture comprend un orchestrateur, des modèles sur l'appareil et côté serveur, ainsi que des capacités multimodales.

Jun 9, 2026, 12:18 AM UTC

OpenClawRadar

News

Annotations Amazon S3 : 1 Go de métadonnées par objet pour les workflows d'agents IA

AWS annonce les annotations S3 — jusqu'à 1 000 annotations par objet, chacune jusqu'à 1 Mo, totalisant 1 Go. Modifiables, interrogeables via Athena, sans frais de récupération pour Glacier.

Jun 19, 2026, 12:15 PM UTC

OpenClawRadar

News

Mark Zuckerberg développe un agent IA pour assister les PDG

Mark Zuckerberg construit un agent d'IA pour l'assister dans ses responsabilités de PDG, selon un rapport du Wall Street Journal discuté sur Hacker News avec 37 points et 30 commentaires.

Mar 23, 2026, 11:45 PM UTC

OpenClawRadar