Gemma-4 26B-A4B с Opencode эффективно работает на M5 MacBook Air.

Разработчик протестировал Gemma-4-26B-A4B с Opencode на 32-гигабайтном MacBook Air M5 и обнаружил, что он обеспечивает практическую производительность для локальных задач ИИ-кодирования.
Бенчмарки производительности
Конкретная протестированная конфигурация: gemma-4-26B-A4B-it-UD-IQ4_XS, работающая на 32-гигабайтном MacBook Air M5. В режиме низкого энергопотребления были достигнуты следующие показатели:
- Обработка промптов: 300 токенов в секунду
- Генерация: 12 токенов в секунду
- Потребление энергии: 8 Вт
- Отсутствие нагрева и шума вентиляторов во время работы
MacBook Air M5 показал значительные улучшения по сравнению с предыдущим оборудованием:
- ~25% более быстрая обработка промптов, чем у M1 Max 64 ГБ (даже когда Max не был в режиме энергосбережения)
- ~6 часов автономной работы против ~2 часов у M1 Max при запуске Opencode
- Это несмотря на меньшую батарею (53,8 Вт·ч против 70 Вт·ч у M1 Max)
Практические сценарии использования
Разработчик назвал эту настройку «действительно пригодной для использования» для агентного кодирования с ноутбука. Ранее запуск LLM на M1 Max 64 ГБ ограничивался «экспериментами и игрушечными сценариями» и не мог эффективно справляться с задачами с длинным контекстом. Хотя он мог создать простую игру «Змейка» на Python, агентное кодирование или работа с крупными кодовыми базами были «немного неуклюжими».
Производительность M5 делает его практичным для мобильных сценариев, где подключение к интернету может быть ненадежным, например, в кофейнях или во время поездок на поезде.
Сравнение с другими моделями
Разработчик сравнил Gemma-4-26B с Opencode с закрытыми альтернативами:
- По их тестам, он не заменяет Claude Code или Antigravity
- Gemma-4 требует «гораздо больше ручного контроля, чем современные закрытые передовые модели»
- Ответы описываются как «довольно сухие» по сравнению с Claude Code или Gemini-3.1-Pro с Antigravity
- Однако они предпочли бы Gemma-4-26B, чем исчерпание лимита Gemini-2.5-Pro и вынужденное использование Gemini-2.5-Flash
Разработчик отмечает, что это представляет значительный прогресс, поскольку «такое агентное кодирование было передовым / даже не совсем возможным с передовыми моделями в конце 2024 года».
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Бета-версия Claude Dispatch: советы по настройке и первые впечатления
Разработчик делится опытом настройки бета-версии Dispatch на Mac Mini, подчеркивая необходимость постоянной работы, конкретных критериев успеха и агрессивных разрешений с включенным Computer Use.

tmux-claude: Мониторинг экземпляров кода Claude в панелях Tmux
tmux-claude — это инструмент, который добавляет мониторинг в реальном времени для экземпляров Claude Code в сессиях tmux. Он предоставляет строку состояния, интерактивную панель управления, улучшенный переключатель окон и уведомления на рабочем столе, считывая локальные файлы сессий без использования API.

Аурелий: Фреймворк React, созданный с помощью 48 кодовых агентов Claude и конвейера Figma-to-React
Aurelius — это фреймворк с открытым исходным кодом для React, который использует 48 иерархически организованных агентов Claude Code для автономной сборки React-приложений из дизайнов Figma. Фреймворк применяет TDD, визуальный контроль качества с пиксельным сравнением и проверки качества перед развёртыванием.

Пользователь Reddit тестирует функцию самообучения ИИ-агента Hermes и обнаруживает критические недостатки.
Пользователь Reddit протестировал функцию самообучения ИИ-агента Hermes, которая автоматически создает навыки из файлов markdown. Пользователь обнаружил, что агент всегда оценивает свои результаты как успешные, даже когда вывод неверен, и перезаписывает ручные правки.