NVIDIA lanza Nemotron-3-Ultra-550B: 55B parámetros activos, 1M de contexto, híbrido LatentMoE

✍️ OpenClawRadar📅 Publicado: 4 de junio de 2026🔗 Source

NVIDIA lanzó Nemotron-3-Ultra-550B-A55B-BF16, un LLM de escala fronteriza con 550B parámetros totales y 55B activos. El modelo utiliza una arquitectura híbrida Latent Mixture-of-Experts (LatentMoE) que intercala capas de Mamba-2, MoE y atención, además de Multi-Token Prediction (MTP) para una generación más rápida. La longitud de contexto alcanza hasta 1M de tokens.

Especificaciones clave

Arquitectura: LatentMoE híbrido – Mamba-2 + MoE + Attention + MTP
Parámetros: 550B totales / 55B activos
Contexto: Hasta 1M de tokens
GPU mínima: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
Idiomas: Inglés, francés, español, italiano, alemán, japonés, coreano, hindi, portugués de Brasil, chino
Razonamiento: Configurable on/off mediante plantilla de chat (enable_thinking=True/False)
Licencia: OpenMDW License Agreement v1.1

El modelo está diseñado para razonamiento de frontera, flujos de trabajo agentivos complejos, análisis de contexto largo, uso de herramientas, razonamiento multilingüe y RAG de alto riesgo. Está entrenado con la receta de preentrenamiento NVFP4 para eficiencia computacional. Se incluyen pesos abiertos, datos de entrenamiento y recetas bajo la licencia OpenMDW. Para inferencia local, necesitarás al menos 8x H200 o equivalente.

📖 Lee la fuente completa: r/LocalLLaMA

👀 Ver también

Noticias

Anthropic lanza una ventana de contexto de 1 millón para Claude Opus sin costo adicional.

Anthropic ha puesto a disposición la ventana de contexto de 1 millón de tokens para todos los usuarios de Claude Code en los planes Max, Team y Enterprise en la versión 2.1.75, eliminando la tarifa de uso adicional anterior. La ventana predeterminada sigue siendo de 200k tokens.

14 mar 2026, 19:45 UTC

OpenClawRadar

Noticias

Claude Code v2.1.121: alwaysLoad de MCP, poda de complementos, correcciones de desplazamiento del terminal y parches de fugas de memoria

Claude Code v2.1.121 añade alwaysLoad para servidores MCP, un comando plugin prune, escritura para filtrar /skills, reemplazo de salida PostToolUse, correcciones de scroll y URL en terminal, y varias correcciones de fugas de memoria incluyendo crecimiento de RSS de varios GB con muchas imágenes.

28 abr 2026, 02:15 UTC

OpenClawRadar

Noticias

Anthropic pausa cambio de crédito para Claude Code: Agent SDK sigue en suscripción

Anthropic detiene el cambio planeado de mover el SDK de Agent, claude -p y aplicaciones de terceros a un crédito mensual dedicado. El uso continúa bajo los límites de suscripción existentes.

16 jun 2026, 00:20 UTC

OpenClawRadar

Noticias

Firefox 148 añade interruptor de apagado de IA y controles de privacidad mejorados.

Firefox 148 presenta una función de "interruptor de apagado de IA" que permite a los usuarios desactivar todas las funcionalidades de IA, incluyendo sugerencias de chatbots y resúmenes de enlaces generados por IA. La actualización también ofrece más control sobre las actualizaciones remotas y la recopilación de datos.

24 feb 2026, 17:45 UTC

OpenClawRadar