Comparaison de référence de Qwen3.6 Plus avec les modèles SOTA occidentaux

✍️ OpenClawRadar📅 Publié: April 5, 2026🔗 Source
Comparaison de référence de Qwen3.6 Plus avec les modèles SOTA occidentaux
Ad

Un post Reddit sur r/LocalLLaMA compare Qwen3.6 Plus à plusieurs modèles occidentaux de pointe à travers plusieurs benchmarks. La comparaison inclut des métriques de performance spécifiques pour chaque modèle.

Résultats des Benchmarks

La source fournit ces scores exacts :

  • Qwen3.6-Plus : SWE-bench Verified 78,8, GPQA / GPQA Diamond 90,4, HLE (sans outils) 28,8, MMMU-Pro 78,8
  • GPT‑5.4 (xhigh) : SWE-bench Verified 78,2, GPQA / GPQA Diamond 93,0, HLE (sans outils) 39,8, MMMU-Pro 81,2
  • Claude Opus 4.6 (thinking heavy) : SWE-bench Verified 80,8, GPQA / GPQA Diamond 91,3, HLE (sans outils) 34,44, MMMU-Pro 77,3
  • Gemini 3.1 Pro Preview : SWE-bench Verified 80,6, GPQA / GPQA Diamond 94,3, HLE (sans outils) 44,7, MMMU-Pro 80,5

Le post inclut un graphique de comparaison visuel disponible à l'adresse : https://preview.redd.it/6kq4tt07yrsg1.png?width=714&format=png&auto=webp&s=ad8b207fb13729ae84f5b74cec5fd84a81dcface

Ad

Évaluation de l'Utilisateur

L'auteur original du post note que Qwen3.6 Plus est "compétitif mais pas le meilleur" et déclare : "Ce sera mon nouveau modèle étant donné son faible coût, mais sa réelle efficacité dépendra de plus que des benchmarks." Il observe également que "Opus surpasse tous les autres malgré sa 3e ou 4e place sur artificalanalysis."

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Granite 4.1 : Le modèle dense 8B d'IBM égale le MoE 32B dans les benchmarks
News

Granite 4.1 : Le modèle dense 8B d'IBM égale le MoE 32B dans les benchmarks

Le modèle dense Granite 4.1 8B d'IBM correspond ou surpasse le précédent modèle MoE 32B sur ArenaHard, BFCL V3, GSM8K et d'autres benchmarks, grâce à une meilleure qualité des données d'entraînement.

OpenClawRadar
Claude Skills vs MCP : une question pratique de frontière pour les développeurs
News

Claude Skills vs MCP : une question pratique de frontière pour les développeurs

Un développeur s'interroge sur le moment où la valeur du MCP devient décisive par rapport aux Compétences Claude, après que la sortie des Compétences a rendu plus difficile le raisonnement sur l'intégration d'outils, notant que des instructions bien structurées peuvent souvent suffire sans frontières protocolaires.

OpenClawRadar
OpenClaw 5.4 ajoute les commandes /steer et /side : rediriger un agent en cours de tâche sans perdre le contexte
News

OpenClaw 5.4 ajoute les commandes /steer et /side : rediriger un agent en cours de tâche sans perdre le contexte

OpenClaw 5.4 introduit les commandes /steer et /side qui permettent de rediriger la direction actuelle d'une tâche d'un agent ou de lancer une conversation parallèle sans perdre le contexte de la session.

OpenClawRadar
Claude Code v2.1.79 : Connexion OAuth défaillante après mise à jour automatique : Solution de contournement et correctif
News

Claude Code v2.1.79 : Connexion OAuth défaillante après mise à jour automatique : Solution de contournement et correctif

Claude Code v2.1.79 présente un bug confirmé de connexion OAuth où l'interface en ligne de commande expire après l'autorisation via le navigateur. Le problème provient de la mise à jour automatique vers cette version par l'installateur natif, et la solution implique de revenir à la version v2.1.75 en supprimant l'installation native.

OpenClawRadar