NVIDIA lance le CPU Vera pour les charges de travail IA agentiques

NVIDIA a présenté le processeur Vera CPU, conçu spécifiquement pour les charges de travail d'IA agentique et d'apprentissage par renforcement. Selon NVIDIA, il offre des résultats avec des performances 50 % plus rapides et une efficacité deux fois supérieure par rapport aux CPU traditionnels à l'échelle du rack.
Spécifications techniques
Le processeur Vera CPU intègre 88 cœurs Olympus personnalisés conçus par NVIDIA, chacun capable d'exécuter deux tâches grâce au multithreading spatial NVIDIA. Il comprend un sous-système mémoire à haut débit basé sur la mémoire LPDDR5X et utilise la deuxième génération du NVIDIA Scalable Coherency Fabric pour des réponses agentiques plus rapides dans des conditions de forte utilisation.
Configurations système
- Le nouveau rack Vera CPU intègre 256 processeurs Vera CPU refroidis par liquide
- Prend en charge plus de 22 500 environnements CPU simultanés fonctionnant indépendamment à pleine performance
- Construit à l'aide de l'architecture de référence modulaire NVIDIA MGX
- Fait partie de la plateforme NVIDIA Vera Rubin NVL72 avec des GPU NVIDIA connectés via l'interconnexion NVIDIA NVLink-C2C
- Offre une bande passante cohérente de 1,8 To/s (7 fois la bande passante PCIe Gen 6)
- Sert également de CPU hôte pour les systèmes NVIDIA HGX Rubin NVL8
- Les systèmes intègrent des cartes NVIDIA ConnectX SuperNIC et des DPU NVIDIA BlueField-4
Adoption et partenaires
Les clients collaborant avec NVIDIA pour déployer le processeur Vera CPU incluent Alibaba, ByteDance, Meta, Oracle Cloud Infrastructure, CoreWeave, Lambda, Nebius et Nscale. Les partenaires de fabrication incluent Dell Technologies, HPE, Lenovo, Supermicro, ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron et Wiwynn.
Charges de travail ciblées
Les systèmes Vera sont conçus pour l'apprentissage par renforcement, l'inférence agentique, le traitement des données, l'orchestration, la gestion du stockage, les applications cloud et le calcul haute performance. Les partenaires systèmes proposent des configurations de serveurs CPU à socket unique et double socket.
Selon Jensen Huang, PDG de NVIDIA, « Le CPU ne se contente plus de soutenir le modèle ; il le pilote. Avec des performances et une efficacité énergétique révolutionnaires, Vera débloque des systèmes d'IA qui pensent plus vite et évoluent plus loin. »
📖 Read the full source: HN AI Agents
👀 See Also

Google, Microsoft et xAI acceptent de partager les premiers modèles d'IA avec le gouvernement américain
Google, Microsoft et xAI (la société d'IA d'Elon Musk) ont accepté de fournir volontairement un accès anticipé à leurs modèles d'IA au gouvernement américain pour des tests de sécurité, dans le cadre d'une initiative rapportée par le Wall Street Journal.

La Cour suprême refuse d'examiner l'affaire, l'art généré par IA reste non protégeable par le droit d'auteur.
La Cour suprême des États-Unis a refusé d'examiner une affaire concernant le droit d'auteur des œuvres d'art générées par IA, laissant ainsi en vigueur les décisions des tribunaux inférieurs qui exigent une 'paternité humaine' pour la protection du droit d'auteur. Cela fait suite au rejet en 2022 par le Bureau du droit d'auteur de la demande de Stephen Thaler de protéger par le droit d'auteur une image créée par son algorithme.

Perspectives des développeurs sur l'anxiété liée à l'IA et la 'psychose de l'IA'
Une discussion sur Reddit révèle une anxiété généralisée parmi les développeurs utilisant des outils d'IA, avec des groupes d'âge différents subissant des pressions distinctes : les 35-45 ans ressentent une pression constante de réinvention, les 25-35 ans s'inquiètent de l'obsolescence de leurs compétences, et les développeurs de moins de 25 ans font face à des risques d'épuisement professionnel malgré leur aisance avec l'IA.

RTX 4090 vs H100 pour le Fine-Tuning de Llama-3-8B : Une Comparaison Coût-Performance
Un développeur a testé le fine-tuning de Llama-3-8B sur une RTX 4090 et sur des instances H100 louées. La configuration avec la 4090 a coûté 2 000 $ d'avance et a pris 24 heures, tandis que la location de H100 a coûté environ 80 $ et s'est terminée en 4 heures.