Оптимизация ANE посредством экспериментов с ИИ, управляемым через телефон, демонстрирует преимущества слияния ядер.

Разработчик провел 55 экспериментов по оптимизации в форке autoresearch-ane, в основном управляя процессом со своего телефона в субботу. Работа была сосредоточена на улучшении производительности Apple Neural Engine (ANE) за счет оптимизации ядер и архитектурных изменений.
Улучшение производительности
Эксперименты дали измеримые улучшения по нескольким показателям:
- Потери при валидации снизились с 3.75 (возврат с оптимизированных 3.2) до 2.49
- Время шага улучшилось с 176 мс до 96 мс
- Использование ANE увеличилось с 3.6% до 6.5%
Ключевое техническое изменение
Наиболее значительное улучшение пришло от слияния ядер: «Объединение 3 ядер ANE в 1 мега-ядро устранило 12 циклов IOSurface за шаг — это одно изменение превзошло все настройки гиперпараметров вместе взятые». Эта архитектурная оптимизация оказалась более эффективной, чем корректировка параметров.
Детали рабочего процесса
Разработчик использовал нестандартный подход:
- Проводил эксперименты удаленно, управляя со своего телефона в короткие моменты
- Использовал Claude для мозгового штурма и извлечения идей из публичных источников, перечисленных в README репозитория
- Подходил к проблеме с «коротким вниманием и минимальным вводом токенов» — предполагая направления, а не диктуя точные шаги
- Выполнил 55 экспериментов с «несколькими случаями фактического набора текста»
- Работал только в неразрушающем режиме из-за ограничений прав доступа («никаких rm -rf /* и подобного»)
Основной вывод
Помимо технических улучшений, разработчик отметил: «Основной вывод не в самом улучшении. А в том, что короткое внимание и минимальный ввод токенов — мозговой штурм направления, а не диктовка шагов — могут дать реальные измеримые результаты в сложной системной задаче».
Работа проводилась на ноутбуке разработчика, и он упоминает о несоответствии в проценте принятия: «55 против 45 не совсем сходится» в отношении результатов экспериментов.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Разработчик создает ИИ-фреймворк с 17 биологическими принципами, используя Claude Code.
Разработчик создал AI-фреймворк под названием Cognitive Sparks, реализовав 17 биологических принципов, таких как пороговое срабатывание и геббовская пластичность, на основе книги 1999 года 'Sparks of Genius'. Весь проект — 22 документа по дизайну и 3300 строк кода — был создан за один день с помощью Claude Code, без кода, написанного человеком.

Rift: лучшая альтернатива Git Worktrees с мгновенными снимками копирования при записи
Rift использует снапшоты btrfs или APFS для мгновенного создания компактных копий репозиториев Git. Инициализация, создание и просмотр через CLI или JavaScript FFI.

LiteParse: Быстрый открытый парсер документов для AI-агентов
LiteParse — это инструмент с открытым исходным кодом для парсинга документов, который обеспечивает пространственный разбор текста с ограничивающими рамками, работает локально без GPU и поддерживает PDF, документы Office и изображения. Его можно установить как навык для более чем 40 ИИ-агентов, включая Claude Code, Cursor и OpenClaw.

SimplePDF Copilot: клиентский AI-инструмент для заполнения PDF-форм
SimplePDF Copilot использует вызов инструментов на стороне клиента, чтобы позволить LLM заполнять поля, добавлять поля, удалять страницы и многое другое в PDF-файлах — без того, чтобы PDF покидал браузер.