NVIDIA Lança Nemotron-3-Ultra-550B: 55B Parâmetros Ativos, 1M de Contexto, Híbrido LatentMoE

✍️ OpenClawRadar📅 Publicado: June 4, 2026🔗 Source

A NVIDIA lançou o Nemotron-3-Ultra-550B-A55B-BF16, um LLM de última geração com 550B parâmetros totais e 55B ativos. O modelo usa uma arquitetura híbrida Latent Mixture-of-Experts (LatentMoE) que intercala camadas Mamba-2, MoE e atenção, além de Previsão de Múltiplos Tokens (MTP) para geração mais rápida. O comprimento do contexto chega a até 1M tokens.

Principais Especificações

Arquitetura: LatentMoE híbrido – Mamba-2 + MoE + Attention + MTP
Parâmetros: 550B total / 55B ativos
Contexto: Até 1M tokens
GPU mínima: 8x GB200/B200/GB300/B300, 16x H100, 8x H200
Idiomas: Inglês, Francês, Espanhol, Italiano, Alemão, Japonês, Coreano, Hindi, Português Brasileiro, Chinês
Raciocínio: Configurável on/off via template de chat (enable_thinking=True/False)
Licença: OpenMDW License Agreement v1.1

O modelo é construído para raciocínio de ponta, fluxos de trabalho agentivos complexos, análise de contexto longo, uso de ferramentas, raciocínio multilíngue e RAG de alto risco. É treinado com receita de pré-treinamento NVFP4 para eficiência computacional. Pesos abertos, dados de treinamento e receitas estão incluídos sob a licença OpenMDW. Para inferência local, você precisará de pelo menos 8x H200 ou equivalente.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

News

Por que a Direção de Ativação da Anthropic tem dificuldade em gerar JSON válido?

A direção de ativação, uma técnica usada para segurança de IA, falha em gerar JSON válido, alcançando apenas 24,4% de validade em comparação com 86,8% do modelo base não treinado.

Feb 13, 2026, 07:45 AM UTC

OpenClawRadar

News

Mudanças na Cobrança do SDK do Claude Agent em 15 de Junho: Créditos por Usuário, Sem Acumulação, Sem Período de Carência

A partir de 15 de junho, o uso do Claude Agent SDK e do claude -p não conta mais contra os limites da sua assinatura. Cada usuário tem um crédito mensal separado (ex.: Pro $20, Max 5x $100). Créditos não são compartilhados, não acumulam e têm um limite rígido.

May 14, 2026, 04:16 AM UTC

OpenClawRadar

News

Geração de Código Determinística vs Probabilística: Por Que a Conversão para Rust com Vibe-Coding do Bun Levanta Bandeiras Vermelhas

Noah Hall argumenta que mudanças de 1M de linhas codadas com "vibe coding" (como a conversão de Zig para Rust do Bun) são perigosas. Contrasta transpiladores determinísticos com saída probabilística de LLMs. Testes não são suficientes.

May 20, 2026, 12:18 AM UTC

OpenClawRadar

News

Claude Code v2.1.214 Lançado: Rastreamento OTel, Correções de Permissão, Ferramenta EndConversation e Proteção Docker

A Anthropic lançou o Claude Code v2.1.214 com correções críticas de permissão para Bash e PowerShell, novos atributos OpenTelemetry, prompts de comando Docker e a ferramenta EndConversation para usuários abusivos.

Jul 18, 2026, 12:15 PM UTC

OpenClawRadar