Qwen3.5-122B-A10B-MINT-MLX работает плавно на M5 Pro с 64 ГБ оперативной памяти.

✍️ OpenClawRadar📅 Опубликовано: 20 апреля 2026 г.🔗 Source
Qwen3.5-122B-A10B-MINT-MLX работает плавно на M5 Pro с 64 ГБ оперативной памяти.
Ad

Производительность локальных языковых моделей на Apple Silicon

Пользователь Reddit поделился своим опытом запуска модели Qwen3.5-122B-A10B-MINT-MLX локально на M5 Pro с 64 ГБ ОЗУ. Эта настройка демонстрирует, что большие языковые модели могут эффективно работать на потребительском оборудовании при правильной конфигурации.

Детали конфигурации

Пользователь добился плавной работы с помощью специальных терминальных команд для выделения видеопамяти:

sysctl iogpu.unified_memory_limit_percentage
sudo sysctl iogpu.wired_limit_mb=61440

В LM Studio они установили размер контекстного окна в 16384 токена. При такой конфигурации система сохраняла стабильную производительность во время работы Safari с несколькими вкладками, Messages и Activity Monitor одновременно.

Ad

Бенчмарки производительности

Модель Qwen3.5-122B-A10B-MINT-MLX показала следующие результаты:

  • Время до первого токена: 0,86 секунды
  • Скорость генерации токенов: 39,58 токенов/секунду

Пользователь отметил, что модель «правильно решила кучу загадок и немного поработала над кодом» без каких-либо нареканий на 3-битную MINT-квантозацию. Единственная проблема возникла, когда контекстное окно заполнилось при использовании около 59 ГБ видеопамяти, что привело к зависанию системы.

Сравнение с другими моделями

Пользователь также протестировал модель «Qwen3.5 40B Claude 4.6 Opus Deckard Heretic Uncensored Thinking Mxfp8», которая оказалась точнее 122B-модели, но значительно медленнее:

  • Скорость генерации токенов: 6,93 токена/секунду
  • Обработка промптов оставалась быстрой, несмотря на медленную генерацию

Это демонстрирует компромисс между размером модели, квантозацией и скоростью вывода, с которым сталкиваются разработчики при выборе конфигураций локальных языковых моделей.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

GitHub отключает возможность Copilot вставлять рекламу в pull-запросы после негативной реакции разработчиков.
Новости

GitHub отключает возможность Copilot вставлять рекламу в pull-запросы после негативной реакции разработчиков.

GitHub отключил функцию Copilot, которая позволяла вставлять рекламные 'советы' в pull requests после того, как разработчики обнаружили, что она добавляет рекламу таких инструментов, как Raycast. Функция, позволявшая Copilot редактировать PR, которые он не создавал, когда его упоминали, была отключена после обратной связи сообщества.

OpenClawRadar
Приложение Claude возглавило чарты App Store в США, ассистенты на базе ИИ заняли первые 10 мест
Новости

Приложение Claude возглавило чарты App Store в США, ассистенты на базе ИИ заняли первые 10 мест

Claude от Anthropic в настоящее время занимает первое место в чарте лучших приложений в американском App Store, ChatGPT находится на втором месте, а Google Gemini — на четвёртом. В первую десятку входят три ассистента с искусственным интеллектом наряду с приложениями для шопинга, социальных сетей и утилитами.

OpenClawRadar
Заявления компании Medvi об искусственном интеллекте стоимостью 1,8 млрд долларов подвергаются проверке из-за юридических и этических вопросов.
Новости

Заявления компании Medvi об искусственном интеллекте стоимостью 1,8 млрд долларов подвергаются проверке из-за юридических и этических вопросов.

Гэри Маркус критикует вирусную историю о Medvi, компании, которая, как утверждается, является ИИ-компанией стоимостью 1,8 млрд долларов, созданной одним человеком за два месяца, указывая на коллективные иски за нарушения правил рассылки спама и задавая вопросы о предоставлении отчетности о доходах и соблюдении нормативных требований.

OpenClawRadar
Claude Code v2.1.121: MCP alwaysLoad, очистка плагинов, исправления прокрутки терминала и исправления утечек памяти
Новости

Claude Code v2.1.121: MCP alwaysLoad, очистка плагинов, исправления прокрутки терминала и исправления утечек памяти

Claude Code v2.1.121 добавляет alwaysLoad для MCP-серверов, команду plugin prune, фильтр по вводу для /skills, замену вывода PostToolUse, исправления прокрутки терминала и URL, а также несколько исправлений утечек памяти, включая рост RSS на несколько ГБ при большом количестве изображений.

OpenClawRadar