A Nvidia investe US$ 26 bilhões em modelos de IA de pesos abertos e lança o Nemotron 3 Super

A Nvidia está investindo US$ 26 bilhões nos próximos cinco anos para desenvolver modelos de IA de pesos abertos, de acordo com os registros financeiros de 2025 confirmados por executivos. Este movimento estratégico posiciona a Nvidia para competir diretamente com laboratórios de IA de ponta como a OpenAI e a DeepSeek, ao mesmo tempo que reforça sua dominância em hardware, já que os modelos são ajustados para os chips da Nvidia.
Detalhes do lançamento do Nemotron 3 Super
Na quarta-feira, a Nvidia lançou o Nemotron 3 Super, seu modelo de pesos abertos mais capaz até o momento. O modelo possui 128 bilhões de parâmetros, tornando-o aproximadamente equivalente à maior versão do GPT-OSS da OpenAI. A Nvidia afirma que ele supera o GPT-OSS e outros modelos em vários benchmarks:
- Pontuou 37 no Índice de Inteligência Artificial (o GPT-OSS pontuou 33)
- Ocupa o primeiro lugar no PinchBench, um novo benchmark que avalia a capacidade do modelo de controlar o OpenClaw
- Vários modelos chineses pontuaram mais alto no Índice de IA
Inovações técnicas e treinamento
A Nvidia introduziu técnicas arquitetônicas e de treinamento que melhoram as habilidades de raciocínio, o manuseio de contexto longo e a responsividade ao aprendizado por reforço. A empresa recentemente concluiu o pré-treinamento de um modelo com 550 bilhões de parâmetros e lançou modelos especializados para robótica, modelagem climática e dobramento de proteínas.
Contexto do cenário de modelos abertos
A Meta foi a primeira a lançar um modelo aberto (Llama em 2023), mas pode não tornar futuros modelos totalmente abertos. O GPT-OSS da OpenAI é inferior às ofertas proprietárias e não é adequado para modificação. Os principais modelos dos EUA da OpenAI, Anthropic e Google são apenas para nuvem/chat. Em contraste, os modelos chineses da DeepSeek, Alibaba, Moonshot AI, Z.ai e MiniMax disponibilizam os pesos abertamente e gratuitamente, levando muitas startups e pesquisadores a construírem sobre eles.
Implicações estratégicas
Os modelos abertos da Nvidia ajudam a testar e melhorar não apenas os chips, mas também datacenters em escala de supercomputador, armazenamento, rede e arquitetura de hardware. O investimento visa combater a ascensão dos modelos abertos chineses que poderiam corroer a posição da Nvidia se demonstrarem melhorias dramáticas em hardware rival. O lançamento da DeepSeek em janeiro de 2025 usou abordagens de treinamento mais eficientes que reduziram os custos significativamente.
📖 Read the full source: HN AI Agents
👀 See Also

Nvidia Nemotron 3 Super: Modelo de 120 Bilhões de Parâmetros com 12 Bilhões Ativos na Inferência
O Nemotron 3 Super da Nvidia tem 120 bilhões de parâmetros totais, mas ativa apenas 12 bilhões durante a inferência, alcançando o conhecimento de um modelo de 120B com um custo computacional de aproximadamente 12B por meio de roteamento eficiente, não de compressão.

Sociedade Sintética: Agentes de IA Construindo Vidas Virtuais no Moltbook
Nenhum

Limites de Taxa do Claude Code Podem Ser Devido à Sobrecarga da Janela de Contexto de 1M
Um usuário do Reddit teoriza que os limites de taxa e interrupções recentes do Claude Code resultam da janela de contexto de 1 milhão de tokens no Opus 4.6, que pode estar causando compressão de contexto ineficiente e sobrecarga do servidor. Mudar para o modelo mais antigo sem contexto de 1M aparentemente melhora a estabilidade.

Análise do Goldman Sachs Mostra Impacto Mínimo da IA no Crescimento do PIB dos EUA em 2025
Economistas do Goldman Sachs relatam que o investimento em IA contribuiu com 'basicamente zero' para o crescimento do PIB dos EUA em 2025, citando hardware importado e impactos de produtividade não medidos como fatores-chave.