Локальный Qwen 3.6 против передовых моделей на задаче программирования: одиночный HTML-файл для анимации на Canvas

Пользователь Reddit провел прямое сравнение локальных квантифицированных моделей с ведущими веб-моделями на конкретном примитиве программирования: генерация одного HTML-файла с полноэкранной canvas-анимацией бокового вида автомобиля, движущегося с параллаксной прокруткой, вращающимися колесами и кинематографическим освещением.
Запрос
Точный запрос требовал один HTML-файл без библиотек, полноэкранный canvas, реалистичную анимацию автомобиля сбоку, многослойный параллаксный пейзаж, вращающиеся колеса, легкое движение кузова, плавное зацикливание и целостное небо/освещение.
Протестированные модели
Ведущие (веб-версии через Perplexity, ток/с не измерялись):
- Claude Sonnet 4.6 Thinking (использовал интернет для рассуждений)
- Gemini 3.1 Pro Thinking
- GPT 5.4 Thinking
- Kimi k2.6 Thinking
Локальные (Ryzen 5 5600, 24 ГБ DDR4-3200, RX 5700 XT 8 ГБ):
- Qwen3.5 9B Q4_K_M — ~50 ток/с
- Qwen3.6-27B (Claude-opus-reasoning-distilled) Q4_K_M — 2.65 ток/с
- Qwen3.6-27B Q4_K_M — 2.70 ток/с
- Qwen3.6-31B A3B Q4_K_M — 12.13 ток/с
- Gemma-4-31b-it — 1.91 ток/с
- Qwen3.5 4B Q8 — 60 ток/с (использовал интернет для рассуждений)
- Qwen3.5 4B Q4_K_M — 80 ток/с (использовал интернет для рассуждений)
Результаты и субъективный рейтинг
Рейтинг для этой конкретной задачи:
- Kimi k2.6 Thinking — самый чистый визуальный результат
- Qwen3.6-27B Q4_K_M (локальная) — лучше ожидаемого; хороший параллакс и ощущение дороги
- Qwen3.6-27B Claude-opus-reasoning-distilled — близкое третье место
Локальная 27B квантифицированная модель показала более естественное движение и наслоение, чем некоторые ведущие модели, для этого конкретного визуального примитива. Автор отметил, что ожидал более явного превосходства ведущих моделей над локальными квантифицированными.
Пользователь менял только тег HTML <title>, чтобы отслеживать, какая модель сгенерировала какой файл. Результаты опубликованы в ветке вместе со скриншотами/GIF-анимациями работающих анимаций.
📖 Source: r/LocalLLaMA
👀 Смотрите также

Стартап по ИИ Янна Лекуна привлек $1 млрд в крупнейшем раунде начального финансирования в Европе.
Стартап в области ИИ Янна Лекуна привлёк 1 миллиард долларов в рамках крупнейшего в Европе раунда посевного финансирования. Новость была опубликована на Hacker News, набрав 186 баллов и 107 комментариев.

Исследование ETH Zurich ставит под сомнение ценность файлов AGENTS.md для ИИ-агентов в программировании
Новое исследование ETH Zurich показывает, что файлы AGENTS.md, сгенерированные LLM, снижают успешность выполнения задач ИИ-агентами на 3% и увеличивают затраты на вывод более чем на 20%, в то время как файлы, написанные человеком, дают лишь незначительный прирост в 4% при аналогичном увеличении затрат.

NVIDIA анонсирует NemoClaw с функциями безопасности OpenShell.
NVIDIA анонсировала NemoClaw на GTC, развивая OpenClaw для добавления корпоративной безопасности через OpenShell, который обеспечивает политики конфиденциальности и защитные механизмы для ИИ-агентов.

Автоматическое обновление Cron сломал OpenClaw из-за ошибки проверки конфигурации.
Запланированное задание cron, настроенное на автоматическое обновление OpenClaw, столкнулось с проблемой валидации конфигурации в поле cliBackends, что привело к потере соединения. Решение заключалось в удалении проблемного раздела и перезапуске шлюза.