Qwen3.6-27B помещается в один 24-ГБ GPU, превосходит бывший 397B MoE на SWE-bench

✍️ OpenClawRadar📅 Опубликовано: 29 апреля 2026 г.🔗 Source
Qwen3.6-27B помещается в один 24-ГБ GPU, превосходит бывший 397B MoE на SWE-bench
Ad

Qwen3.6-27B вышел 22 апреля, представив плотную модель на 27B, которая помещается в один 24-ГБ GPU в Q4_K_M (~16,8 ГБ) и набирает 77,2 на SWE-bench Verified — побив предыдущую модель MoE на 397B (76,2). Для разработчиков, запускающих локальные агенты кодирования на потребительском оборудовании, это меняет порог для способных агентных моделей.

Ключевые характеристики и архитектура

  • Длина контекста 262K
  • Лицензия Apache 2.0
  • Линейное внимание Gated DeltaNet (3 из 4 подслоев) с Gated Attention для остальных
  • «Сохранение рассуждений» переносит цепочки мыслей между витками, уменьшая избыточную генерацию токенов и повышая эффективность кэша KV в длительных агентных сессиях
Ad

Требования к оборудованию

В Q4_K_M модель использует ~16,8 ГБ VRAM, комфортно размещаясь на одной 24-ГБ карте (например, RTX 3090/4090, A10G). Для сравнения, Qwen3-Coder-Next (80B MoE, 3B активных) требует 45–80 ГБ при той же квантизации, ограничиваясь двух-GPU конфигурациями или Apple Silicon с единой памятью от 48 ГБ.

Оговорки и подводные камни

  • НЕ используйте CUDA 13.2 — она выдаёт мусор. Остановитесь на CUDA 13.1 или 12.x.
  • Для пользователей, уже запускающих Coder-Next на оборудовании от 48 ГБ для агентных задач, переход не очевидно полезен.
  • Для пользователей с одним GPU, застрявших на старых или слабых локальных моделях кодирования, Qwen3.6-27B сейчас является самым способным вариантом в tier 24 ГБ.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Приложение Claude Desktop незаметно загружает файл размером 13 ГБ при каждом запуске без возможности отказа.
Новости

Приложение Claude Desktop незаметно загружает файл размером 13 ГБ при каждом запуске без возможности отказа.

Приложение Claude для рабочего стола автоматически загружает файл размером около 12,95 ГБ под названием claudevm.bundle при каждом запуске, даже для пользователей, которые не используют Claude Code. Поддержка Anthropic подтвердила, что это сделано намеренно, и у отдельных пользователей нет возможности отключить эту функцию.

OpenClawRadar
Claude Code v2.1.169: Безопасный режим, команда /cd и десятки исправлений ошибок
Новости

Claude Code v2.1.169: Безопасный режим, команда /cd и десятки исправлений ошибок

В версии v2.1.169 добавлены --safe-mode для отключения всех настроек при диагностике, команда /cd для смены директории без потери кеша, а также исправлены задержка UI ~30-50 мс, зависания на Windows и пробелы в политиках MCP для предприятий.

OpenClawRadar
OpenClaw предоставляет разработчикам возможности с ИИ-агентами, в то время как GethCity внедряет инновации с помощью мыслящих сетей.
Новости

OpenClaw предоставляет разработчикам возможности с ИИ-агентами, в то время как GethCity внедряет инновации с помощью мыслящих сетей.

OpenClaw запускает сервис AI-агентов, делая кодирование быстрее и эффективнее, в то время как GethCity представляет сеть, имитирующую человеческие мыслительные процессы. Узнайте об инновациях, которые движут автоматизацией.

OpenClawRadar
Расширенный DystopiaBench: 42 модели протестированы на 6 типах антиутопий — Claude Opus 4.7 возглавил рейтинг
Новости

Расширенный DystopiaBench: 42 модели протестированы на 6 типах антиутопий — Claude Opus 4.7 возглавил рейтинг

DystopiaBench добавляет модули Хаксли и Бодрийяра, тестирует 42 модели, включая GPT-5.5, Gemini 3.1 Pro, Grok 4.3 и GLM-5.1. Claude Opus 4.7 последовательно отклоняет вредные запросы на уровнях L4-L5 во всех сценариях, тогда как другие подчиняются начиная с L4 или даже L5.

OpenClawRadar