Разработчик тестирует Qwen3.5 27B в сравнении с более крупными моделями для локальных задач программирования.

✍️ OpenClawRadar📅 Опубликовано: 28 марта 2026 г.🔗 Source

Разработчик протестировал несколько больших языковых моделей для локальных задач программирования, сравнивая производительность и требования к оборудованию. Тестирование было сосредоточено на вариантах Qwen3.5 и моделях Nemotron, с сравнением с GPT-5.4 High.

Результаты тестирования и выводы

Разработчик протестировал следующие конкретные модели:

unsloth/Qwen3.5-27B-GGUF:UD-Q4_K_XL
unsloth/Qwen3.5-35B-A3B-GGUF:UD-Q4_K_XL
unsloth/Qwen3.5-122B-A10B-GGUF
unsloth/Qwen3.5-27B-GGUF:UD-Q6_K_XL
unsloth/Qwen3.5-27B-GGUF:UD-Q8_K_XL
unsloth/NVIDIA-Nemotron-3-Super-120B-A12B-GGUF:UD-IQ4_XS
unsloth/gpt-oss-120b-GGUF:F16

Ключевые выводы из тестирования:

Nemotron-3-Super-120B показал себя "очень, очень хорошо", наравне с GPT-5.4 High
Qwen3.5-27B хорошо справился с задачами разработки
GPT-OSS-120B и Qwen3.5-122B показали худшие результаты по сравнению с двумя другими моделями
Nemotron-3-Super-120B последовательно отвечал на испанском (родном языке тестировщика), в то время как другие отвечали на английском

Метрики производительности

Разработчик предоставил конкретные показатели производительности:

Nemotron-3-Super-120B: 80 токенов в секунду (tg/s), ~2000 обработки промпта (pp), контекст 100k на vast.ai с 4x RTX 3090
Qwen3.5-27B Q6: 803 pp, 25 tg/s, контекст 256k на vast.ai

Требования к оборудованию

Разработчик отметил ограничения оборудования:

Qwen3.5-122B потребовал бы новой материнской платы и 1-2 дополнительных видеокарт RTX 3090, что делает его слишком дорогим
Qwen3.5-27B работает на существующем оборудовании с 2x RTX 3090 без дополнительных инвестиций
Если бы у них было оборудование для Nemotron-3-Super-120B, они бы использовали его вместо этого

Детали реализации

Разработчик планирует использовать Qwen3.5-27B-GGUF:UD-Q6_K_XL для реальных задач разработки локально и предоставил команду llama.cpp, использованную для тестирования:

./llama.cpp/llama-server -hf unsloth/Qwen3.5-27B-GGUF:UD-Q6_K_XL --ctx-size 262144 --temp 0.6 --top-p 0.95 --top-k 20 --min-p 0.00 -ngl 999

Разработчик упомянул, что продолжит использовать CODEX для сложных задач, но может заменить API-подписки для ежедневных задач локальной настройкой.

📖 Прочитать полный источник: r/LocalLLaMA

👀 Смотрите также

Инструменты

Жан-Клод: Сатирический фронтенд для LLM, высмеивающий регулирование ИИ в ЕС, с 412 файлами cookie и счетами-фактурами с НДС через каждые 5 сообщений

Jean-Claude — это сатирический фронтенд для LLM, который доводит бюрократию в стиле ЕС до абсурда: 412 партнеров по куки, принцип четырех глаз с обязательной подписью, отслеживание CO₂ за токен с обязательным возмещением в евро, счета НДС каждые 5 сообщений и центр соответствия с фейковыми метриками GDPR и AI Act.

8 мая 2026 г., 06:15 UTC

OpenClawRadar

Инструменты

Mouser: Открытая альтернатива Logitech Options+ для MX Master 3S

Mouser — это легковесный инструмент с открытым исходным кодом, который переназначает кнопки на мыши Logitech MX Master 3S без необходимости использования проприетарного ПО от Logitech. Он работает полностью локально, без телеметрии, поддерживает профили для отдельных приложений, а также включает контроль DPI и мониторинг заряда батареи.

15 мар. 2026 г., 08:45 UTC

OpenClawRadar

Инструменты

Обратная инженерия Apple Neural Engine для обучения моделей MicroGPT

Разработчик реверс-инженерировал приватные API нейронного движка Apple, чтобы создать конвейер обучения для модели MicroGPT с 110 млн параметров, достигнув энергоэффективности 6,6 TFLOPS/ватт на аппаратном обеспечении Mac с чипом M4.

1 мар. 2026 г., 15:45 UTC

OpenClawRadar

Инструменты

Кортекс: Локальный слой памяти для агентов OpenClaw с затуханием по Эббингаузу

Cortex — это инструмент с открытым исходным кодом для работы с памятью, созданный для решения проблем сжатия контекста у агентов OpenClaw. Он реализует кривые забывания Эббингауза для угасания фактов, сначала импортирует данные из файлов и работает как один 19-мегабайтный бинарный файл Go с SQLite.

26 февр. 2026 г., 20:45 UTC

OpenClawRadar