Qwen 3.6 vs Modèles Frontières : Test Animation HTML Canvas

Un utilisateur de Reddit a réalisé une comparaison directe entre des modèles quantifiés locaux et des modèles web de pointe sur une primitive de codage spécifique : générer un fichier HTML unique avec une animation canvas plein écran d'une voiture vue de côté roulant avec défilement parallaxe, roues tournantes et éclairage cinématographique.

Le prompt

Le prompt exact demandait un fichier HTML unique sans bibliothèques, un canvas plein écran, une animation réaliste de voiture vue de côté, un décor à calques parallaxe, des roues tournantes, un mouvement subtil de la carrosserie, une boucle fluide et un ciel/éclairage cohérent.

Modèles testés

De pointe (via Perplexity, tok/s non mesuré) :

Claude Sonnet 4.6 Thinking (a utilisé internet pour le raisonnement)
Gemini 3.1 Pro Thinking
GPT 5.4 Thinking
Kimi k2.6 Thinking

Locaux (Ryzen 5 5600, 24 Go DDR4-3200, RX 5700 XT 8 Go) :

Qwen3.5 9B Q4_K_M — ~50 tok/s
Qwen3.6-27B (Claude-opus-reasoning-distilled) Q4_K_M — 2,65 tok/s
Qwen3.6-27B Q4_K_M — 2,70 tok/s
Qwen3.6-31B A3B Q4_K_M — 12,13 tok/s
Gemma-4-31b-it — 1,91 tok/s
Qwen3.5 4B Q8 — 60 tok/s (a utilisé internet pour le raisonnement)
Qwen3.5 4B Q4_K_M — 80 tok/s (a utilisé internet pour le raisonnement)

Résultats et classement subjectif

Le classement pour cette tâche spécifique :

Kimi k2.6 Thinking — résultat visuel le plus propre globalement
Qwen3.6-27B Q4_K_M (local) — plus performant que prévu ; bon parallaxe et sensation de route
Qwen3.6-27B Claude-opus-reasoning-distilled — troisième proche

Le 27B quantifié local a produit un mouvement et un calque plus naturels que certains modèles de pointe pour cette primitive visuelle spécifique. L'auteur a noté qu'il s'attendait à ce que les modèles de pointe surpassent plus nettement les quantifiés locaux.

L'utilisateur a seulement changé les balises HTML <title> pour suivre quel modèle a généré quel fichier. Les sorties sont partagées dans le fil avec des captures d'écran/GIF des animations en cours.

📖 Lire la source complète : r/LocalLLaMA

Titre local Qwen 3.6 vs modèles frontières sur une primitive de codage : Animation de conduite de toile HTML mono-fichier

Le prompt

Modèles testés

Résultats et classement subjectif

👀 See Also

Proposition de routage d'inférence adaptative pour l'efficacité des requêtes d'IA

Crise d'accessibilité de l'IA : OpenAI et Anthropic dépensent entre 8 et 14 dollars pour en gagner 1

Étude de Stanford : Les professeurs de droit préfèrent les réponses de l'IA à celles de leurs pairs dans 75% des cas

Claude Code 2.1.83 en version : Mise en cache des invites, vérification des compétences et mises à jour du SDK