Gemma 4 Lanzada: 4 Tamaños de Modelo para IA Local

Especificaciones del Modelo Gemma 4

Gemma 4 ya está disponible como un modelo de IA autoalojado con cuatro configuraciones distintas para diferentes escenarios de hardware. Según la fuente, no compite con Claude, Codex o Gemini, sino que se posiciona como una opción práctica para escenarios de enrutamiento múltiple donde un modelo autoalojado pequeño y capaz puede ahorrar tokens.

Variantes del Modelo y Requisitos de Hardware

E2B (2.3 mil millones de parámetros efectivos): Diseñado para dispositivos de borde como teléfonos y Raspberry Pi. Requiere ~4-8 GB de RAM y funciona bien en una CPU. Recomendado para alojar en VPS.
E4B (4.5 mil millones de parámetros efectivos): Diseñado para portátiles y hardware de gama baja. Mantiene una huella de memoria baja.
26B MoE (25 mil millones totales, 3.8 mil millones activos): Diseñado para GPUs de consumo. Funciona a velocidades de inferencia similares a un modelo de 4B.
31B Denso: Diseñado para GPUs de gama media y estaciones de trabajo. Requiere aproximadamente 16-20 GB de VRAM cuando se usa cuantización de 4 bits.

Capacidades y Disponibilidad

Todos los modelos Gemma 4 son multimodales con capacidades tanto de texto como de visión. Los modelos de borde E2B y E4B admiten específicamente audio en tiempo real. Los modelos están diseñados para razonamiento avanzado y flujos de trabajo agentes.

Gemma 4 está disponible en Google AI Studio, Hugging Face, Kaggle y Ollama.

📖 Read the full source: r/openclaw

Gemma 4 Lanzada: Cuatro Tamaños de Modelo para Alojamiento Local de IA

Especificaciones del Modelo Gemma 4

Variantes del Modelo y Requisitos de Hardware

Capacidades y Disponibilidad

👀 Ver también

NVIDIA anuncia NemoClaw con funciones de seguridad OpenShell.

llama.cpp con cuantización Q8_0 obtiene una aceleración de 3.1x en GPUs Intel Arc con la corrección de reordenamiento SYCL.

El benchmark IDP Leaderboard muestra que Claude Sonnet 4.6 iguala a Opus 4.6 en tareas de IA para documentos.

Autoresearch impulsa a Qwen3.5-397B a 20.34 tok/s en M5 Max mediante transmisión SSD