Orion: Обход CoreML для запуска и обучения LLM напрямую на Apple Neural Engine

✍️ OpenClawRadar📅 Опубликовано: 7 марта 2026 г.🔗 Source

Прямой доступ к ANE для работы с LLM

Orion предоставляет сквозную систему на Objective-C, которая полностью обходит CoreML для запуска и обучения LLM непосредственно на Apple Neural Engine (ANE). Этот подход даёт разработчикам прямой контроль над ANE, который ранее CoreML обрабатывал как «чёрный ящик»-планировщик, лишая любого прямого управления или возможности обучения.

Техническая реализация и ограничения

Проект основан на работе по реверс-инжинирингу, в ходе которой были сопоставлены приватные API ANEClient и ANECompiler. ANE представляет собой то, что разработчик называет «аппаратным несоответствием импеданса» с 17 общими программными ограничениями, 11 из которых были полностью недокументированы. Ключевые ограничения включают:

Операция concat вызывает немедленный, тихий сбой компилятора
Веса BLOBFILE требуют смещения в 64 байта от заголовка чанка, иначе происходит тихое числовое искажение
ANE поддерживает внутреннее состояние, которое жёстко ограничивается примерно 119 компиляциями на процесс перед тихим сбоем

Решения проблем обучения

Предыдущие попытки обучения на ANE сталкивались с расхождением NaN после одного шага. Orion решает это с помощью:

Настройки конвейера отложенной компиляции
Реализации строгого ограничения активаций для предотвращения каскадного переполнения fp16 (ограничение активаций от -65504 до +65504)
Использования цикла перезапуска процесса exec() после каждого шага обучения для обхода ограничения в 119 компиляций

Результаты производительности

Компилятор преобразует граф IR из 27 операций через пять этапов оптимизации в нативный для ANE MIL. Текущая производительность включает:

Более 170 токенов/с для декодирования GPT-2 124M
Механически стабильное многошаговое обучение трансформера с 110 млн параметров («потолок связности» аппаратного обеспечения)
За более чем 1000 шагов потери снизились с 12,3 до 6,2 без единого NaN

Текущие ограничения

ANE запекает веса во время компиляции, что означает, что каждое обновление обучения требует штрафа за перекомпиляцию около 4,2 с. ANE выдаёт примерно 19 TFLOPS в fp16, но фундаментальным ограничением для его использования была не вычислительная мощность, а полное отсутствие нативного уровня оркестрации.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Any Buddy v2.0.0 добавляет функцию предварительного просмотра для Claude Code Buddies.

Any Buddy v2.0.0 представляет функцию предварительного просмотра, которая позволяет пользователям тестировать различных помощников перед применением их к коду Claude, а также платформенные исправления для Linux, Mac и Windows. Инструмент получил 160 звёзд на GitHub с момента выпуска.

14 апр. 2026 г., 03:45 UTC

OpenClawRadar

Инструменты

Wisepanel MCP Server обеспечивает многоуровневое обсуждение между несколькими LLM в Claude Code и Cursor.

Wisepanel выпустил MCP-сервер, который запускает многоагентные обсуждения прямо из Claude Code, Cursor или любого MCP-клиента, используя систему дивергентного контекстного улучшения с моделями ChatGPT, Claude, Gemini и Perplexity.

25 февр. 2026 г., 03:45 UTC

OpenClawRadar

Инструменты

Плагин Godmode добавляет автономный цикл итераций в Claude Code и другие AI-агенты для программирования.

Godmode — это плагин с открытым исходным кодом, который добавляет в Claude Code автономный цикл «измерить-изменить-проверить» с параллельными агентами, памятью о неудачах и 126 навыками, включая оптимизацию, аудит безопасности и TDD. Работает с Cursor, Codex, Gemini CLI и OpenCode.

16 апр. 2026 г., 11:07 UTC

OpenClawRadar

Инструменты

Говорите с Когтем: Открытый голосовой интерфейс для iOS для Telegram-ботов OpenClaw

Приложение с открытым исходным кодом для iOS, которое позволяет взаимодействовать с ботами Telegram на платформе OpenClaw с помощью голоса. Приложение отправляет аудио на локальный сервер Mac для обработки, а ответы возвращаются как в текстовом, так и в аудиоформате.

26 февр. 2026 г., 14:45 UTC

OpenClawRadar