Nvidia compromete $26B en modelos de IA de pesos abiertos, lanza Nemotron 3 Super

Nvidia está invirtiendo $26 mil millones durante los próximos cinco años para desarrollar modelos de IA de pesos abiertos, según los informes financieros de 2025 confirmados por ejecutivos. Este movimiento estratégico posiciona a Nvidia para competir directamente con laboratorios de IA de vanguardia como OpenAI y DeepSeek, mientras refuerza su dominio en hardware, ya que los modelos están optimizados para los chips de Nvidia.
Detalles del lanzamiento de Nemotron 3 Super
El miércoles, Nvidia lanzó Nemotron 3 Super, su modelo de pesos abiertos más capaz hasta la fecha. El modelo tiene 128 mil millones de parámetros, lo que lo hace aproximadamente equivalente a la versión más grande del GPT-OSS de OpenAI. Nvidia afirma que supera a GPT-OSS y otros modelos en varios puntos de referencia:
- Obtuvo 37 en el Índice de Inteligencia Artificial (GPT-OSS obtuvo 33)
- Ocupa el primer lugar en PinchBench, un nuevo punto de referencia que evalúa la capacidad del modelo para controlar OpenClaw
- Varios modelos chinos obtuvieron puntuaciones más altas en el Índice de IA
Innovaciones técnicas y entrenamiento
Nvidia introdujo técnicas arquitectónicas y de entrenamiento que mejoran las capacidades de razonamiento, el manejo de contextos largos y la capacidad de respuesta al aprendizaje por refuerzo. La compañía recientemente terminó el preentrenamiento de un modelo de 550 mil millones de parámetros y ha lanzado modelos especializados para robótica, modelado climático y plegamiento de proteínas.
Contexto del panorama de modelos abiertos
Meta fue la primera en lanzar un modelo abierto (Llama en 2023) pero podría no hacer que los modelos futuros sean completamente abiertos. El GPT-OSS de OpenAI es inferior a las ofertas propietarias y no es adecuado para modificaciones. Los principales modelos estadounidenses de OpenAI, Anthropic y Google son solo para nube/chat. En contraste, los modelos chinos de DeepSeek, Alibaba, Moonshot AI, Z.ai y MiniMax publican los pesos de forma abierta y gratuita, lo que lleva a muchas startups e investigadores a construir sobre ellos.
Implicaciones estratégicas
Los modelos abiertos de Nvidia ayudan a probar y mejorar no solo los chips, sino también los centros de datos a escala de supercomputadoras, el almacenamiento, las redes y la arquitectura de hardware. La inversión tiene como objetivo contrarrestar el auge de los modelos abiertos chinos que podrían erosionar la posición de Nvidia si demuestran mejoras dramáticas en hardware rival. El lanzamiento de DeepSeek en enero de 2025 utilizó enfoques de entrenamiento más eficientes que redujeron los costos significativamente.
📖 Read the full source: HN AI Agents
👀 Ver también

Fundador de OpenClaw, Peter Steinberger en el radar: Perspectivas de la entrevista de YC.
El fundador de OpenClaw, Peter Steinberger, llama la atención de YC, lo que genera conversaciones sobre el futuro de los agentes de codificación de IA. Sumérgete en los aspectos más destacados de esta charla significativa que promete influir en la trayectoria de la automatización y la integración de agentes de IA.

Lanzamiento de Claude-Code v2.1.38: Principales correcciones y mejoras.
Claude-Code v2.1.38 aborda regresiones en el terminal de VS Code, problemas con la tecla Tab y correcciones de permisos en comandos bash. También mejora el análisis de heredocs y la seguridad en modo sandbox.

Desarrollador de FFmpeg acusa a OxideAV de lavado de licencias de IA en el problema de MagicYUV
Un desarrollador de FFmpeg ha abierto un issue en el repositorio magicyuv de OxideAV, cuestionando la licencia del proyecto y alegando un lavado de licencia asistido por IA de código GPL.

Claude AI presenta actualizaciones del complemento Cowork con personalización empresarial y nuevos conectores.
Claude AI ha lanzado actualizaciones del complemento Cowork que permiten a los administradores empresariales crear mercados privados de complementos y agregar conectores para Google Workspace, Docusign, Apollo y otras herramientas. Una nueva vista previa de investigación permite a Claude trabajar en Excel y PowerPoint para análisis integrales y creación de presentaciones.