Nvidia investit 26 milliards de dollars dans des modèles d'IA à poids ouvert et lance Nemotron 3 Super.

Nvidia investit 26 milliards de dollars au cours des cinq prochaines années pour développer des modèles d'IA à poids ouverts, selon les documents financiers de 2025 confirmés par les dirigeants. Cette décision stratégique positionne Nvidia pour concurrencer directement les laboratoires d'IA de pointe comme OpenAI et DeepSeek, tout en renforçant sa domination matérielle puisque les modèles sont optimisés pour les puces de Nvidia.
Détails de la sortie de Nemotron 3 Super
Mercredi, Nvidia a publié Nemotron 3 Super, son modèle à poids ouvert le plus performant à ce jour. Le modèle compte 128 milliards de paramètres, ce qui le rend à peu près équivalent à la plus grande version de GPT-OSS d'OpenAI. Nvidia affirme qu'il surpasse GPT-OSS et d'autres modèles sur plusieurs benchmarks :
- A obtenu un score de 37 sur l'Artificial Intelligence Index (GPT-OSS a obtenu 33)
- Se classe premier sur PinchBench, un nouveau benchmark évaluant la capacité des modèles à contrôler OpenClaw
- Plusieurs modèles chinois ont obtenu des scores plus élevés sur l'AI Index
Innovations techniques et entraînement
Nvidia a introduit des techniques architecturales et d'entraînement qui améliorent les capacités de raisonnement, la gestion de contexte long et la réactivité à l'apprentissage par renforcement. La société a récemment terminé le pré-entraînement d'un modèle à 550 milliards de paramètres et a publié des modèles spécialisés pour la robotique, la modélisation climatique et le repliement des protéines.
Contexte du paysage des modèles ouverts
Meta a été le premier à publier un modèle ouvert (Llama en 2023) mais pourrait ne pas rendre les futurs modèles entièrement ouverts. GPT-OSS d'OpenAI est inférieur aux offres propriétaires et ne se prête pas bien aux modifications. Les meilleurs modèles américains d'OpenAI, Anthropic et Google sont uniquement cloud/chat. En revanche, les modèles chinois de DeepSeek, Alibaba, Moonshot AI, Z.ai et MiniMax publient ouvertement et gratuitement leurs poids, ce qui conduit de nombreuses startups et chercheurs à s'appuyer sur eux.
Implications stratégiques
Les modèles ouverts de Nvidia aident à tester et améliorer non seulement les puces, mais aussi les datacenters à l'échelle des super-ordinateurs, le stockage, le réseau et l'architecture matérielle. L'investissement vise à contrer la montée des modèles ouverts chinois qui pourraient éroder la position de Nvidia s'ils démontrent des améliorations spectaculaires sur du matériel concurrent. La sortie de DeepSeek en janvier 2025 a utilisé des approches d'entraînement plus efficaces qui ont réduit considérablement les coûts.
📖 Read the full source: HN AI Agents
👀 See Also

Claude Code v2.1.37 Publié
Anthropic publie une nouvelle version de Claude Code avec des améliorations et des corrections de bugs.

Claude Code ajoute la saisie vocale avec fonctionnalité de pousser-pour-parler.
Claude Code déploie le mode vocal à environ 5 % des utilisateurs initialement, avec une activation push-to-talk en maintenant la barre d'espace. Les jetons de transcription vocale ne comptent pas dans les limites de taux et la fonctionnalité est incluse sans frais supplémentaires.

Configuration des Sous-agents dans OpenClaw : Considérations Clés
Les utilisateurs qui expérimentent OpenClaw rencontrent des difficultés lors de la configuration des sous-agents, en particulier lors de la modification des fichiers JSON.

InclusionAI dévoile Ring-2.6-1T : modèle à un trillion de paramètres pour les flux de travail des agents
InclusionAI a dévoilé Ring-2.6-1T, un modèle de raisonnement de 1 billion de paramètres optimisé pour l'exécution par agent, avec deux niveaux d'effort de raisonnement (high/xhigh) et un apprentissage par renforcement asynchrone via l'algorithme IcePop.