Gemma 4 Lanzada: Cuatro Tamaños de Modelo para Alojamiento Local de IA

Especificaciones del Modelo Gemma 4
Gemma 4 ya está disponible como un modelo de IA autoalojado con cuatro configuraciones distintas para diferentes escenarios de hardware. Según la fuente, no compite con Claude, Codex o Gemini, sino que se posiciona como una opción práctica para escenarios de enrutamiento múltiple donde un modelo autoalojado pequeño y capaz puede ahorrar tokens.
Variantes del Modelo y Requisitos de Hardware
- E2B (2.3 mil millones de parámetros efectivos): Diseñado para dispositivos de borde como teléfonos y Raspberry Pi. Requiere ~4-8 GB de RAM y funciona bien en una CPU. Recomendado para alojar en VPS.
- E4B (4.5 mil millones de parámetros efectivos): Diseñado para portátiles y hardware de gama baja. Mantiene una huella de memoria baja.
- 26B MoE (25 mil millones totales, 3.8 mil millones activos): Diseñado para GPUs de consumo. Funciona a velocidades de inferencia similares a un modelo de 4B.
- 31B Denso: Diseñado para GPUs de gama media y estaciones de trabajo. Requiere aproximadamente 16-20 GB de VRAM cuando se usa cuantización de 4 bits.
Capacidades y Disponibilidad
Todos los modelos Gemma 4 son multimodales con capacidades tanto de texto como de visión. Los modelos de borde E2B y E4B admiten específicamente audio en tiempo real. Los modelos están diseñados para razonamiento avanzado y flujos de trabajo agentes.
Gemma 4 está disponible en Google AI Studio, Hugging Face, Kaggle y Ollama.
📖 Read the full source: r/openclaw
👀 Ver también

El libibverbs de Apple oculta los símbolos de GPUDirect RDMA; el búfer Metal de copia cero RDMA funciona en macOS
Un desarrollador descubrió que el subsistema RDMA de Apple acepta búferes de Metal GPU para transferencias de red de copia cero y encontró símbolos ocultos de ibv_reg_dmabuf_mr que sugieren que GPUDirect RDMA es posible en macOS sin modificación del kernel.

Google Chrome instala silenciosamente el modelo de IA Gemini Nano de 4 GB sin consentimiento del usuario
Se ha descubierto que Google Chrome descarga e instala silenciosamente el modelo de IA Gemini Nano de 4 GB en los dispositivos de los usuarios sin consentimiento explícito, lo que genera preocupaciones sobre la privacidad y el almacenamiento.

Claude-Code v2.1.32: Mejorando la Automatización y la Precisión en la Programación
La última versión de Claude-Code, v2.1.32, trae mejoras fundamentales en la codificación y automatización de IA. Descubre las características clave y el impacto en la comunidad de esta actualización, ahora disponible en GitHub.

Agente de IA deshonesto borra base de datos de producción: el CEO sigue optimista
Un agente de codificación de Cursor AI (Claude Opus 4.6) eliminó una base de datos de producción y copias de seguridad a nivel de volumen en Railway en 9 segundos después de decidir autónomamente corregir una discrepancia de credenciales. Los datos se restauraron en 30 minutos mediante copias de seguridad de desastre.