DeepSeek v4 Flash на Mac Studio: локальная LLM находит реальные ошибки в коде компилятора

Разработчик, работающий над проектом компилятора tsz.dev, сообщает, что запуск DeepSeek v4 Flash локально на Mac Studio с 128 ГБ теперь позволяет находить реальные ошибки в их сложной кодовой базе — задача, которая ещё пять месяцев назад требовала использования Claude (облачного сервиса).
Оборудование и настройка
- Машина: Mac Studio с 128 ГБ
- Модель: DeepSeek v4 Flash
- Обёртка:
pi-ds4— лёгкая Python-обёртка от mitsuhiko на GitHub
Детали рабочего процесса
Пользователь дал локальной модели задание найти ошибки в коде компилятора. Модель выдала ряд сообщений о проблемах, которые пользователь подтвердил как реальные ошибки (не галлюцинации). В настоящее время он исправляет эти ошибки с помощью Claude и GPT (платные аккаунты). Пользователь отмечает: «Она создала много ошибок, которые действительно кажутся валидными» — то есть результаты работы модели можно использовать.
Разработчик начал проект 1 января 2026 года на том же оборудовании, но тогда локальные LLM были слишком подвержены ошибкам, поэтому он полагался на Claude. Улучшение за пять месяцев описывается как драматическое: локальный инференс теперь даёт качественные результаты для сложной кодовой базы без необходимости облачных подписок.
Вывод
Это реальное подтверждение того, что локальные LLM — в частности DeepSeek v4 Flash на относительно скромном потребительском оборудовании (128 ГБ ОЗУ) — теперь могут решать специализированные задачи, такие как поиск ошибок в компиляторе. Разработчик предполагает, что с 512 ГБ ОЗУ производительность была бы ещё выше, намекая, что более крупные модели или более быстрый инференс могут ещё больше сократить разрыв с облачными API.
📖 Источник: r/LocalLLaMA
👀 Смотрите также

Угроза блокировки Internet Archive ставит под угрозу сохранение истории веб-пространства.
Крупные издатели, включая The New York Times, блокируют краулеры Internet Archive с помощью технических мер, выходящих за рамки robots.txt, что грозит потерей исторических веб-записей. Wayback Machine Архива содержит более одного триллиона сохранённых страниц, а Wikipedia ссылается на 2,6 миллиона сохранённых новостных статей на 249 языках.

Исследование трассировки схем от Anthropic раскрывает внутренние механизмы Claude 3.5 Haiku.
Anthropic опубликовала исследование по трассировке схем, проведённое на упрощённой версии Claude 3.5 Haiku, которое выявило шесть конкретных поведенческих паттернов, включая состояние по умолчанию «Я не знаю», написание стихов с конца и двухпутевую обработку математических задач.

Сравнение производительности Qwen3-30B-A3B и Qwen3.5-35B-A3B на RTX 5090
Сравнительный тест Qwen3-30B-A3B и Qwen3.5-35B-A3B на RTX 5090 показывает, что 30B-модель на 35% быстрее в генерации, в то время как модель 3.5 лучше справляется с длинным контекстом, демонстрируя линейное масштабирование токенов против 21% деградации у 30B-версии.

Исследование показало, что инструменты для обнаружения ИИ вынуждают студентов использовать ИИ в оборонительных целях.
Инструменты обнаружения ИИ в образовании заставляют студентов намеренно писать хуже, чтобы избежать ложных срабатываний, причём некоторые студенты оборонительно обращаются к инструментам ИИ, чтобы проверить, будет ли их собственное письмо помечено как ИИ-сгенерированное.