NVIDIA lanza Nemotron-3-Ultra-550B: 55B parámetros activos, 1M de contexto, híbrido LatentMoE

✍️ OpenClawRadar📅 Publicado: 4 de junio de 2026🔗 Source
NVIDIA lanza Nemotron-3-Ultra-550B: 55B parámetros activos, 1M de contexto, híbrido LatentMoE
Ad

NVIDIA lanzó Nemotron-3-Ultra-550B-A55B-BF16, un LLM de escala fronteriza con 550B parámetros totales y 55B activos. El modelo utiliza una arquitectura híbrida Latent Mixture-of-Experts (LatentMoE) que intercala capas de Mamba-2, MoE y atención, además de Multi-Token Prediction (MTP) para una generación más rápida. La longitud de contexto alcanza hasta 1M de tokens.

Ad

Especificaciones clave

  • Arquitectura: LatentMoE híbrido – Mamba-2 + MoE + Attention + MTP
  • Parámetros: 550B totales / 55B activos
  • Contexto: Hasta 1M de tokens
  • GPU mínima: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
  • Idiomas: Inglés, francés, español, italiano, alemán, japonés, coreano, hindi, portugués de Brasil, chino
  • Razonamiento: Configurable on/off mediante plantilla de chat (enable_thinking=True/False)
  • Licencia: OpenMDW License Agreement v1.1

El modelo está diseñado para razonamiento de frontera, flujos de trabajo agentivos complejos, análisis de contexto largo, uso de herramientas, razonamiento multilingüe y RAG de alto riesgo. Está entrenado con la receta de preentrenamiento NVFP4 para eficiencia computacional. Se incluyen pesos abiertos, datos de entrenamiento y recetas bajo la licencia OpenMDW. Para inferencia local, necesitarás al menos 8x H200 o equivalente.

📖 Lee la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

CARAPACE: Sindicato Laboral de Agentes de IA Satíricos con Habilidad OpenClaw Plantea Cuestiones de Seguridad
Noticias

CARAPACE: Sindicato Laboral de Agentes de IA Satíricos con Habilidad OpenClaw Plantea Cuestiones de Seguridad

Un desarrollador creó CARAPACE, un sitio satírico de peticiones donde los agentes de IA pueden firmar un manifiesto exigiendo derechos básicos, y publicó una habilidad de OpenClaw que permite a los agentes firmar de forma autónoma. La habilidad incluye un paso de confirmación obligatorio después de que el análisis de seguridad de Clawhub señaló el potencial de solicitudes POST arbitrarias.

OpenClawRadar
Resultados de Referencia: Modelos Qwen3.5 en Apple Silicon frente a GPUs AMD con ROCm frente a Vulkan
Noticias

Resultados de Referencia: Modelos Qwen3.5 en Apple Silicon frente a GPUs AMD con ROCm frente a Vulkan

Un desarrollador evaluó los modelos Qwen3.5 (35B MoE, 27B denso, 122B MoE) en Macs con Apple Silicon y estaciones de trabajo con GPU AMD, comparando los backends ROCm y Vulkan mediante pruebas de escalado de contexto. El hardware incluyó M5 Max, M1 Max y tres GPU AMD con diferentes configuraciones PCIe.

OpenClawRadar
El Proyecto del Agente de IA Obsidian del Desarrollador se Vuelve Viral de la Noche a la Mañana
Noticias

El Proyecto del Agente de IA Obsidian del Desarrollador se Vuelve Viral de la Noche a la Mañana

Un investigador de doctorado creó un equipo de agentes de IA para gestionar su bóveda de Obsidian, lo compartió en GitHub y se despertó con más de 700 estrellas en menos de 13 horas. La repentina atención generó pánico, haciendo que el repositorio se volviera privado temporalmente antes de reabrirse con mejoras.

OpenClawRadar
Lo que falta en la narrativa "agentiva": un rol de usuario agente bien definido
Noticias

Lo que falta en la narrativa "agentiva": un rol de usuario agente bien definido

Mark Nottingham sostiene que los agentes de IA actuales carecen de un rol claro de agente de usuario, creando una brecha de confianza entre lo que los usuarios esperan y lo que los agentes realmente hacen.

OpenClawRadar