Nemotron 3 Super: Nvidia investit 26B$ dans l'IA open source

Nvidia investit 26 milliards de dollars au cours des cinq prochaines années pour développer des modèles d'IA à poids ouverts, selon les documents financiers de 2025 confirmés par les dirigeants. Cette décision stratégique positionne Nvidia pour concurrencer directement les laboratoires d'IA de pointe comme OpenAI et DeepSeek, tout en renforçant sa domination matérielle puisque les modèles sont optimisés pour les puces de Nvidia.

Détails de la sortie de Nemotron 3 Super

Mercredi, Nvidia a publié Nemotron 3 Super, son modèle à poids ouvert le plus performant à ce jour. Le modèle compte 128 milliards de paramètres, ce qui le rend à peu près équivalent à la plus grande version de GPT-OSS d'OpenAI. Nvidia affirme qu'il surpasse GPT-OSS et d'autres modèles sur plusieurs benchmarks :

A obtenu un score de 37 sur l'Artificial Intelligence Index (GPT-OSS a obtenu 33)
Se classe premier sur PinchBench, un nouveau benchmark évaluant la capacité des modèles à contrôler OpenClaw
Plusieurs modèles chinois ont obtenu des scores plus élevés sur l'AI Index

Innovations techniques et entraînement

Nvidia a introduit des techniques architecturales et d'entraînement qui améliorent les capacités de raisonnement, la gestion de contexte long et la réactivité à l'apprentissage par renforcement. La société a récemment terminé le pré-entraînement d'un modèle à 550 milliards de paramètres et a publié des modèles spécialisés pour la robotique, la modélisation climatique et le repliement des protéines.

Contexte du paysage des modèles ouverts

Meta a été le premier à publier un modèle ouvert (Llama en 2023) mais pourrait ne pas rendre les futurs modèles entièrement ouverts. GPT-OSS d'OpenAI est inférieur aux offres propriétaires et ne se prête pas bien aux modifications. Les meilleurs modèles américains d'OpenAI, Anthropic et Google sont uniquement cloud/chat. En revanche, les modèles chinois de DeepSeek, Alibaba, Moonshot AI, Z.ai et MiniMax publient ouvertement et gratuitement leurs poids, ce qui conduit de nombreuses startups et chercheurs à s'appuyer sur eux.

Implications stratégiques

Les modèles ouverts de Nvidia aident à tester et améliorer non seulement les puces, mais aussi les datacenters à l'échelle des super-ordinateurs, le stockage, le réseau et l'architecture matérielle. L'investissement vise à contrer la montée des modèles ouverts chinois qui pourraient éroder la position de Nvidia s'ils démontrent des améliorations spectaculaires sur du matériel concurrent. La sortie de DeepSeek en janvier 2025 a utilisé des approches d'entraînement plus efficaces qui ont réduit considérablement les coûts.

📖 Read the full source: HN AI Agents

Nvidia investit 26 milliards de dollars dans des modèles d'IA à poids ouvert et lance Nemotron 3 Super.

Détails de la sortie de Nemotron 3 Super

Innovations techniques et entraînement

Contexte du paysage des modèles ouverts

Implications stratégiques

👀 See Also

Neuf schémas d'échec courants des agents de codage IA et validation pré-exécution

Claude Opus 4.5 et Sonnet 4.5 retirés de la sélection de modèles, nécessitent un indicateur de lancement.

Granite 4.1 : Le modèle dense 8B d'IBM égale le MoE 32B dans les benchmarks

Mise à jour du statut de Claude : Taux d'erreur élevés pour Opus 4.6 et Sonnet 4.6