Gemma-4 26B-A4B: Cómo ejecutarlo en MacBook Air M5

Un desarrollador probó Gemma-4-26B-A4B con Opencode en una MacBook Air M5 de 32GB y descubrió que ofrece un rendimiento práctico para tareas locales de IA de programación.

Puntos de Referencia de Rendimiento

La configuración específica probada fue gemma-4-26B-A4B-it-UD-IQ4_XS ejecutándose en una MacBook Air M5 de 32GB. En modo de bajo consumo, logró:

300 tokens/segundo en procesamiento de prompts
12 tokens/segundo en generación
8W de consumo de energía
Sin calor ni ruido del ventilador durante la operación

La MacBook Air M5 mostró mejoras significativas sobre el hardware anterior:

~25% más rápido en procesamiento de prompts que un M1 Max de 64GB (incluso cuando el Max no estaba en modo de ahorro de energía)
~6 horas de duración de batería versus ~2 horas en el M1 Max al ejecutar Opencode
Esto a pesar de tener una batería más pequeña (53.8Wh vs 70Wh en el M1 Max)

Casos de Uso Prácticos

El desarrollador encontró que esta configuración es "realmente utilizable" para comportamiento de programación agéntico desde una laptop. Anteriormente, ejecutar LLMs en un M1 Max de 64GB se limitaba a "experimentar y casos de uso de juguete" y no podía manejar tareas de contexto más largo de manera efectiva. Aunque podía crear un juego simple de Snake en Python, la programación agéntica o contribuir a bases de código más grandes era "un poco inestable".

El rendimiento del M5 lo hace práctico para casos de uso móviles donde la conectividad a internet podría ser poco confiable, como cafeterías o viajes en tren.

Comparación con Otros Modelos

El desarrollador comparó Gemma-4-26B con Opencode con alternativas de código cerrado:

No reemplaza a Claude Code o Antigravity según sus pruebas
Gemma-4 requiere "mucho más acompañamiento que los modelos de vanguardia de código cerrado actuales"
Las respuestas se describen como "algo secas" en comparación con Claude Code o Gemini-3.1-Pro con Antigravity
Sin embargo, preferirían Gemma-4-26B sobre quedarse sin la asignación de Gemini-2.5-Pro y verse obligados a usar Gemini-2.5-Flash

El desarrollador señala que esto representa un progreso significativo, ya que "este tipo de programación agéntica era de vanguardia / ni siquiera realmente posible con modelos de vanguardia a finales de 2024".

📖 Read the full source: r/LocalLLaMA

Gemma-4 26B-A4B con Opencode se ejecuta eficientemente en el MacBook Air M5.

Puntos de Referencia de Rendimiento

Casos de Uso Prácticos

Comparación con Otros Modelos

👀 Ver también

Pneuma: Un Entorno de Escritorio Generado por IA Donde el Software se Materializa a Partir de Descripciones

Nit: Un Reemplazo de Git en Zig Optimizado para la Eficiencia de Tokens de Agentes de IA

HF Viewer: Visualice instantáneamente cualquier gráfico de modelo de Hugging Face

Sistema de Consejo de Comercio Multiagente Utilizando GPT-5.1 y Claude 4.6