Gemma-4 26B-A4B con Opencode se ejecuta eficientemente en el MacBook Air M5.

✍️ OpenClawRadar📅 Publicado: 14 de abril de 2026🔗 Source
Gemma-4 26B-A4B con Opencode se ejecuta eficientemente en el MacBook Air M5.
Ad

Un desarrollador probó Gemma-4-26B-A4B con Opencode en una MacBook Air M5 de 32GB y descubrió que ofrece un rendimiento práctico para tareas locales de IA de programación.

Puntos de Referencia de Rendimiento

La configuración específica probada fue gemma-4-26B-A4B-it-UD-IQ4_XS ejecutándose en una MacBook Air M5 de 32GB. En modo de bajo consumo, logró:

  • 300 tokens/segundo en procesamiento de prompts
  • 12 tokens/segundo en generación
  • 8W de consumo de energía
  • Sin calor ni ruido del ventilador durante la operación

La MacBook Air M5 mostró mejoras significativas sobre el hardware anterior:

  • ~25% más rápido en procesamiento de prompts que un M1 Max de 64GB (incluso cuando el Max no estaba en modo de ahorro de energía)
  • ~6 horas de duración de batería versus ~2 horas en el M1 Max al ejecutar Opencode
  • Esto a pesar de tener una batería más pequeña (53.8Wh vs 70Wh en el M1 Max)

Casos de Uso Prácticos

El desarrollador encontró que esta configuración es "realmente utilizable" para comportamiento de programación agéntico desde una laptop. Anteriormente, ejecutar LLMs en un M1 Max de 64GB se limitaba a "experimentar y casos de uso de juguete" y no podía manejar tareas de contexto más largo de manera efectiva. Aunque podía crear un juego simple de Snake en Python, la programación agéntica o contribuir a bases de código más grandes era "un poco inestable".

El rendimiento del M5 lo hace práctico para casos de uso móviles donde la conectividad a internet podría ser poco confiable, como cafeterías o viajes en tren.

Ad

Comparación con Otros Modelos

El desarrollador comparó Gemma-4-26B con Opencode con alternativas de código cerrado:

  • No reemplaza a Claude Code o Antigravity según sus pruebas
  • Gemma-4 requiere "mucho más acompañamiento que los modelos de vanguardia de código cerrado actuales"
  • Las respuestas se describen como "algo secas" en comparación con Claude Code o Gemini-3.1-Pro con Antigravity
  • Sin embargo, preferirían Gemma-4-26B sobre quedarse sin la asignación de Gemini-2.5-Pro y verse obligados a usar Gemini-2.5-Flash

El desarrollador señala que esto representa un progreso significativo, ya que "este tipo de programación agéntica era de vanguardia / ni siquiera realmente posible con modelos de vanguardia a finales de 2024".

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Mia: Daemon de Espacio de Trabajo de IA Local con Aplicación Nativa para Android y Transmisión P2P
Herramientas

Mia: Daemon de Espacio de Trabajo de IA Local con Aplicación Nativa para Android y Transmisión P2P

Mia es un demonio que se ejecuta en tu máquina y se empareja con una aplicación nativa de Android mediante P2P, permitiéndote iniciar y monitorear tareas de codificación con IA de larga duración desde tu teléfono. Es compatible con los agentes OpenCode, Claude Code, Gemini CLI y Codex, transmitiendo la salida directamente a tu dispositivo en tiempo real.

OpenClawRadar
PocketBot: Un piloto automático de IA local para iOS que utiliza App Intents e inferencia en el dispositivo
Herramientas

PocketBot: Un piloto automático de IA local para iOS que utiliza App Intents e inferencia en el dispositivo

PocketBot es una aplicación iOS que ejecuta un modelo Llama 3B cuantizado localmente en el Neural Engine del iPhone mediante Metal, utilizando los frameworks AppIntents y CoreLocation de Apple para crear automatizaciones basadas en eventos sin transmisión de datos a la nube.

OpenClawRadar
Repowise: El contexto precomputado del código base para Claude Code reduce el uso de tokens y el tiempo de tarea a la mitad
Herramientas

Repowise: El contexto precomputado del código base para Claude Code reduce el uso de tokens y el tiempo de tarea a la mitad

Repowise indexa tu base de código en cuatro capas (grafo de dependencias, señales de git, wiki de documentación, ADRs) y expone ocho herramientas MCP a Claude Code, reduciendo una sesión de arqueología de 30 archivos a 5 llamadas MCP y 2 minutos.

OpenClawRadar
OpenClaw-Superpowers: Un puerto nativo del framework Superpowers de Jesse Vincent sin dependencia de Claude Code
Herramientas

OpenClaw-Superpowers: Un puerto nativo del framework Superpowers de Jesse Vincent sin dependencia de Claude Code

Un usuario de Reddit portó obra/superpowers a OpenClaw con agentes dedicados (orquestador de codificación, implementador, revisor) y comandos nativos como sessions_spawn y update_plan, eliminando la dependencia de Claude Code.

OpenClawRadar