Nvidia Investe US$ 26B em IA Aberta e Lança Nemotron 3 Super

A Nvidia está investindo US$ 26 bilhões nos próximos cinco anos para desenvolver modelos de IA de pesos abertos, de acordo com os registros financeiros de 2025 confirmados por executivos. Este movimento estratégico posiciona a Nvidia para competir diretamente com laboratórios de IA de ponta como a OpenAI e a DeepSeek, ao mesmo tempo que reforça sua dominância em hardware, já que os modelos são ajustados para os chips da Nvidia.

Detalhes do lançamento do Nemotron 3 Super

Na quarta-feira, a Nvidia lançou o Nemotron 3 Super, seu modelo de pesos abertos mais capaz até o momento. O modelo possui 128 bilhões de parâmetros, tornando-o aproximadamente equivalente à maior versão do GPT-OSS da OpenAI. A Nvidia afirma que ele supera o GPT-OSS e outros modelos em vários benchmarks:

Pontuou 37 no Índice de Inteligência Artificial (o GPT-OSS pontuou 33)
Ocupa o primeiro lugar no PinchBench, um novo benchmark que avalia a capacidade do modelo de controlar o OpenClaw
Vários modelos chineses pontuaram mais alto no Índice de IA

Inovações técnicas e treinamento

A Nvidia introduziu técnicas arquitetônicas e de treinamento que melhoram as habilidades de raciocínio, o manuseio de contexto longo e a responsividade ao aprendizado por reforço. A empresa recentemente concluiu o pré-treinamento de um modelo com 550 bilhões de parâmetros e lançou modelos especializados para robótica, modelagem climática e dobramento de proteínas.

Contexto do cenário de modelos abertos

A Meta foi a primeira a lançar um modelo aberto (Llama em 2023), mas pode não tornar futuros modelos totalmente abertos. O GPT-OSS da OpenAI é inferior às ofertas proprietárias e não é adequado para modificação. Os principais modelos dos EUA da OpenAI, Anthropic e Google são apenas para nuvem/chat. Em contraste, os modelos chineses da DeepSeek, Alibaba, Moonshot AI, Z.ai e MiniMax disponibilizam os pesos abertamente e gratuitamente, levando muitas startups e pesquisadores a construírem sobre eles.

Implicações estratégicas

Os modelos abertos da Nvidia ajudam a testar e melhorar não apenas os chips, mas também datacenters em escala de supercomputador, armazenamento, rede e arquitetura de hardware. O investimento visa combater a ascensão dos modelos abertos chineses que poderiam corroer a posição da Nvidia se demonstrarem melhorias dramáticas em hardware rival. O lançamento da DeepSeek em janeiro de 2025 usou abordagens de treinamento mais eficientes que reduziram os custos significativamente.

📖 Read the full source: HN AI Agents