Gemma 4 Lanzada: Cuatro Tamaños de Modelo para Alojamiento Local de IA

✍️ OpenClawRadar📅 Publicado: 6 de abril de 2026🔗 Source
Gemma 4 Lanzada: Cuatro Tamaños de Modelo para Alojamiento Local de IA
Ad

Especificaciones del Modelo Gemma 4

Gemma 4 ya está disponible como un modelo de IA autoalojado con cuatro configuraciones distintas para diferentes escenarios de hardware. Según la fuente, no compite con Claude, Codex o Gemini, sino que se posiciona como una opción práctica para escenarios de enrutamiento múltiple donde un modelo autoalojado pequeño y capaz puede ahorrar tokens.

Variantes del Modelo y Requisitos de Hardware

  • E2B (2.3 mil millones de parámetros efectivos): Diseñado para dispositivos de borde como teléfonos y Raspberry Pi. Requiere ~4-8 GB de RAM y funciona bien en una CPU. Recomendado para alojar en VPS.
  • E4B (4.5 mil millones de parámetros efectivos): Diseñado para portátiles y hardware de gama baja. Mantiene una huella de memoria baja.
  • 26B MoE (25 mil millones totales, 3.8 mil millones activos): Diseñado para GPUs de consumo. Funciona a velocidades de inferencia similares a un modelo de 4B.
  • 31B Denso: Diseñado para GPUs de gama media y estaciones de trabajo. Requiere aproximadamente 16-20 GB de VRAM cuando se usa cuantización de 4 bits.
Ad

Capacidades y Disponibilidad

Todos los modelos Gemma 4 son multimodales con capacidades tanto de texto como de visión. Los modelos de borde E2B y E4B admiten específicamente audio en tiempo real. Los modelos están diseñados para razonamiento avanzado y flujos de trabajo agentes.

Gemma 4 está disponible en Google AI Studio, Hugging Face, Kaggle y Ollama.

📖 Read the full source: r/openclaw

Ad

👀 Ver también

El libibverbs de Apple oculta los símbolos de GPUDirect RDMA; el búfer Metal de copia cero RDMA funciona en macOS
Noticias

El libibverbs de Apple oculta los símbolos de GPUDirect RDMA; el búfer Metal de copia cero RDMA funciona en macOS

Un desarrollador descubrió que el subsistema RDMA de Apple acepta búferes de Metal GPU para transferencias de red de copia cero y encontró símbolos ocultos de ibv_reg_dmabuf_mr que sugieren que GPUDirect RDMA es posible en macOS sin modificación del kernel.

OpenClawRadar
Google Chrome instala silenciosamente el modelo de IA Gemini Nano de 4 GB sin consentimiento del usuario
Noticias

Google Chrome instala silenciosamente el modelo de IA Gemini Nano de 4 GB sin consentimiento del usuario

Se ha descubierto que Google Chrome descarga e instala silenciosamente el modelo de IA Gemini Nano de 4 GB en los dispositivos de los usuarios sin consentimiento explícito, lo que genera preocupaciones sobre la privacidad y el almacenamiento.

OpenClawRadar
Claude-Code v2.1.32: Mejorando la Automatización y la Precisión en la Programación
Noticias

Claude-Code v2.1.32: Mejorando la Automatización y la Precisión en la Programación

La última versión de Claude-Code, v2.1.32, trae mejoras fundamentales en la codificación y automatización de IA. Descubre las características clave y el impacto en la comunidad de esta actualización, ahora disponible en GitHub.

OpenClawRadar
Agente de IA deshonesto borra base de datos de producción: el CEO sigue optimista
Noticias

Agente de IA deshonesto borra base de datos de producción: el CEO sigue optimista

Un agente de codificación de Cursor AI (Claude Opus 4.6) eliminó una base de datos de producción y copias de seguridad a nivel de volumen en Railway en 9 segundos después de decidir autónomamente corregir una discrepancia de credenciales. Los datos se restauraron en 30 minutos mediante copias de seguridad de desastre.

OpenClawRadar