Обратная инженерия Apple Neural Engine для обучения моделей MicroGPT

✍️ OpenClawRadar📅 Опубликовано: 1 марта 2026 г.🔗 Source
Обратная инженерия Apple Neural Engine для обучения моделей MicroGPT
Ad

Прямой доступ к нейронному движку Apple

Разработчик обошёл фреймворк CoreML от Apple, чтобы получить прямой доступ к нейронному движку Apple (ANE) на Mac mini с чипом M4, создав собственный конвейер обучения для небольших языковых моделей. Проект включал реверс-инжиниринг приватных API ANE с помощью Claude, затем проведение бенчмарков и реализацию обучения без рекомендованного Apple интерфейса CoreML.

Технические характеристики и производительность

ANE на чипе M4 обеспечивает заявленные 38 TFLOPS вычислений INT8, хотя разработчик отмечает, что это фактически процессор FP16, что делает эффективную вычислительную мощность вдвое меньше. Пиковая производительность ANE потребляет всего 2,8 Вт, обеспечивая энергоэффективность 6,6 TFLOPS/ватт. Для сравнения, GPU Metal достигает примерно 1 TFLOPS/ватт, а NVIDIA H100 — 1,4 TFLOPS/ватт.

Реализация обучения

Разработчик создал специализированный конвейер обучения, который успешно обучил модель MicroGPT с 110 млн параметров на ANE. Хотя один чип не может практически обучать более крупные модели, разработчик предполагает, что кластер устройств с ANE теоретически мог бы обучать более масштабные модели. Даже на одном устройстве обучение с использованием LoRA для моделей с 3 или 7 млрд параметров должно быть осуществимо.

Ad

Зачем обучать на NPU?

Основная мотивация — энергоэффективность. Эффективность ANE в 6,6 TFLOPS/ватт делает его значительно более энергоэффективным по сравнению с традиционными методами обучения на GPU, что особенно ценно для периферийных вычислений и энергоэффективной разработки.

Доступные ресурсы

  • Документация по реверс-инжинирингу
  • Результаты бенчмарков
  • Реализация обучения (в процессе разработки)
  • Репозиторий GitHub с кодом

Проект демонстрирует, что нейронный движок Apple, обычно рассматриваемый как «чёрный ящик», можно использовать напрямую для пользовательских рабочих процессов обучения ИИ, предлагая разработчикам альтернативу обучению на GPU с превосходной энергоэффективностью.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Эксперимент по сравнительному анализу кода с использованием трех ИИ-инструментов на одной кодовой базе
Инструменты

Эксперимент по сравнительному анализу кода с использованием трех ИИ-инструментов на одной кодовой базе

Видеоэксперимент тестирует Codex, Claude Code и Claude Code с Sextant на одинаковых задачах по ревью кода, где Codex проверяет результаты и оценивает, какой отчёт более полезен. Основное внимание уделяется тому, как рабочий процесс и структура влияют на то, что замечает ИИ и что он приоритезирует.

OpenClawRadar
多LLM论文交易机器人:以Claude Opus为主工程师、Gemini为策略师——架构解析
Инструменты

多LLM论文交易机器人:以Claude Opus为主工程师、Gemini为策略师——架构解析

Один разработчик рассказал о торговом боте для бумажной торговли объемом 4900 строк кода на платформе Alpaca, где Claude Opus 4 (инженер) имеет право вето на решения Gemini Pro (стратег), а журнал разногласий насчитывает более 270 записей и называется «Кодекс стратега».

OpenClawRadar
Плагин Quick-Question автоматизирует разработку в Unity с помощью кода Claude.
Инструменты

Плагин Quick-Question автоматизирует разработку в Unity с помощью кода Claude.

Разработчик выпустил quick-question, плагин для macOS под Unity 2021.3+, который автоматизирует компиляцию, тестирование и перекрёстную проверку кода при использовании Claude Code. Инструмент включает 20 слеш-команд и использует паттерн «Трибунал», где Codex и Claude проверяют выводы друг друга.

OpenClawRadar
Навык Claude Code создает скриншоты для App Store с использованием искусственного интеллекта Gemini.
Инструменты

Навык Claude Code создает скриншоты для App Store с использованием искусственного интеллекта Gemini.

Новый навык Claude Code под названием /aso-cosmicmeta-ss создаёт скриншоты для App Store и Google Play с помощью 6-этапного рабочего процесса, который анализирует код и использует Gemini AI для улучшения. Навык включает контрольный этап для выявления проблем с макетом перед использованием API-кредитов.

OpenClawRadar