Сравнение Dual DGX Sparks и Mac Studio M3 Ultra: практический тест для локального запуска Qwen3.5 397B

✍️ OpenClawRadar📅 Опубликовано: 27 марта 2026 г.🔗 Source

Сравнение оборудования для локального запуска Qwen3.5 397B

Разработчик тратил $2K в месяц на токены Claude API, прежде чем инвестировать $20K в локальное оборудование: Mac Studio M3 Ultra 512GB и настройку с двумя DGX Spark, каждый из которых стоил около $10K после налогов. Оба были протестированы при локальном запуске Qwen3.5 397B A17B.

Производительность Mac Studio M3 Ultra 512GB

С использованием 6-битной квантизации MLX, 323-гигабайтная модель загружалась в 512 ГБ унифицированной памяти. Скорость генерации составляла 30-40 токенов в секунду при пропускной способности памяти примерно 800 ГБ/с, что делало генерацию токенов плавной. Настройка была простой: установить mlx vlm и указать на модель. К слабым сторонам относились медленное предзаполнение (более 30 секунд на больших системных промптах) и снижение производительности при одновременном запуске пакетного эмбеддинга и инференса. Разработчику пришлось написать 500-строчный асинхронный прокси, потому что mlx vlm не парсит вызовы инструментов и не удаляет токены размышления нативно.

Производительность настройки с двумя DGX Spark

С использованием INT4 AutoRound квантизации, 98 ГБ загружались на узел на двух узлах по 128 ГБ через vLLM TP=2. Скорость генерации составляла 27-28 токенов в секунду. Настройка использовала тензорные ядра CUDA, ядра vLLM и тензорный параллелизм для более быстрого предзаполнения по сравнению с Mac Studio. Пакетный эмбеддинг, который занимал дни на MLX, завершался за часы на CUDA. Пропускная способность памяти составляла примерно 273 ГБ/с на узел, что ограничивало скорость генерации, несмотря на большее количество вычислений.

Сложности настройки были значительными: работал только один кабель QSFP (второй приводил к краху NCCL), IP-адрес Node2 был эфемерным, потолок использования памяти GPU составлял 0.88 (потребовался бинарный поиск для нахождения), каждая неверная догадка стоила 15 минут, пока перезагружались шарды контрольных точек, кеш страниц нужно было сбрасывать на обоих узлах перед каждой загрузкой модели, а некоторые блоки начинали троттлинг по температуре в течение 20 минут. Разработчик сообщил, что для достижения стабильности потребовались дни.

Архитектура и сценарий использования

Разработчик сохранил обе системы, используя Mac Studio только для инференса (полные 512 ГБ для модели и KV-кеша), а Sparks — для RAG, эмбеддинга, реранкинга и других задач. Они общаются через Tailscale. Это разделение предотвращает конкуренцию моделей эмбеддинга с основной моделью за память на Mac Studio, предоставляя им выделенные ресурсы CUDA на Sparks.

Сравнительные характеристики

Стоимость: Обе $10K
Память: Mac Studio 512 ГБ унифицированной vs. Sparks 256 ГБ (128×2)
Пропускная способность: Mac Studio ~800 ГБ/с vs. Sparks ~273 ГБ/с на узел
Квантизация: Mac Studio MLX 6-битная (323 ГБ) vs. Sparks INT4 AutoRound (98 ГБ/узел)
Скорость генерации: Mac Studio 30-40 токенов/с vs. Sparks 27-28 токенов/с
Макс. контекст: Mac Studio 256K токенов vs. Sparks 130K+ токенов
Настройка: Mac Studio простая, но требующая участия vs. Sparks сложная
Сильная сторона: Mac Studio пропускная способность vs. Sparks вычислительная мощность
Слабая сторона: Mac Studio вычислительная мощность vs. Sparks пропускная способность

👀 Смотрите также

Инструменты

Расширение CtxSnap для VS Code отслеживает изменения файлов для сессий Claude.

CtxSnap — это расширение для VS Code, которое отслеживает изменения файлов с момента вашей последней сессии с Claude и упаковывает их в готовый для вставки блок передачи с содержимым файлов и индикатором бюджета токенов, настроенным на контекстное окно Claude в 200k токенов.

19 апр. 2026 г., 17:45 UTC

OpenClawRadar

Инструменты

23 навыка агента для разработки под iOS 26 с использованием SwiftUI и Swift 6.2

Разработчик создал 23 навыка агента, ориентированные на iOS 26+ и Swift 6.2, для решения проблем с галлюцинациями, связанными с устаревшими API и устаревшими паттернами. Навыки охватывают SwiftUI, SwiftData, StoreKit 2, push-уведомления, сетевые взаимодействия, конкурентность, доступность, локализацию, WidgetKit, MapKit и многое другое.

8 мар. 2026 г., 03:45 UTC

OpenClawRadar

Инструменты

Фреймворк с открытым исходным кодом для мультиагентных систем, извлечённый из утечки кода Claude.

Разработчик извлек систему оркестрации мультиагентов из утекшего исходного кода Claude Code и перестроил ее в модель-независимый фреймворк с открытым исходным кодом под лицензией MIT. Фреймворк на TypeScript объемом 8 000 строк включает планирование задач, меж-агентное взаимодействие и встроенные инструменты.

1 апр. 2026 г., 12:45 UTC

OpenClawRadar

Инструменты

ForgeAI: Визуальная рабочая платформа для инженерии моделей

ForgeAI предоставляет визуальный интерфейс для инспекции, объединения и обучения моделей, предлагая такие функции, как проверка архитектуры 3D моделей и M-DNA Forge для визуального объединения слоев.

13 февр. 2026 г., 05:45 UTC

OpenClawRadar

Сравнение оборудования для локального запуска Qwen3.5 397B

Производительность Mac Studio M3 Ultra 512GB

Производительность настройки с двумя DGX Spark

Архитектура и сценарий использования

Сравнительные характеристики

Рекомендации

👀 Смотрите также

Расширение CtxSnap для VS Code отслеживает изменения файлов для сессий Claude.

23 навыка агента для разработки под iOS 26 с использованием SwiftUI и Swift 6.2

Фреймворк с открытым исходным кодом для мультиагентных систем, извлечённый из утечки кода Claude.

ForgeAI: Визуальная рабочая платформа для инженерии моделей