Nvidia RTX Spark : Un superchip de 1 pétaflop amène des agents IA locaux sur les PC Windows

Nvidia a annoncé aujourd'hui RTX Spark, un nouveau superchip qui apporte 1 pétaflop de calcul IA aux PC Windows, conçu spécialement pour exécuter des agents IA personnels en local. La puce combine un GPU RTX Blackwell (6 144 cœurs CUDA, cœurs Tensor de cinquième génération avec FP4), un CPU Grace à 20 cœurs et jusqu'à 128 Go de mémoire unifiée, le tout connecté via NVLink-C2C. MediaTek a contribué à la conception du CPU personnalisé basé sur Arm pour l'efficacité énergétique.
Spécifications clés et capacités
- Performance IA : 1 pétaflop (FP4)
- GPU : Blackwell RTX avec 6 144 cœurs CUDA
- CPU : Nvidia Grace 20 cœurs (Arm), co-conçu avec MediaTek
- Mémoire : jusqu'à 128 Go de mémoire unifiée
- Pile logicielle : CUDA, RTX, DLSS, FP4, TensorRT, OptiX, Reflex, G-SYNC
Le RTX Spark peut exécuter localement des LLM de 120 milliards de paramètres avec jusqu'à 1 million de tokens de contexte, rendre des scènes 3D de plus de 90 Go, éditer de la vidéo 12K 4:2:2, générer de la vidéo IA 4K et jouer à des jeux AAA en 1440p à plus de 100 fps.
Sécurité native des agents Windows
Nvidia et Microsoft collaborent sur de nouvelles primitives de sécurité Windows et le runtime Nvidia OpenShell pour permettre des agents sécurisés sur l'appareil. La couche de sécurité fournit l'identité, le confinement, les politiques et une sécurité de bout en bout. OpenShell ajoute des politiques définies par l'utilisateur pour les capacités des agents, le routage intelligent des requêtes vers des modèles locaux ou cloud, et le masquage des informations personnelles dans les requêtes vers le cloud.
Les frameworks d'agents, notamment Hermes Agent et OpenClaw, développent des applications Windows sur cette pile, permettant des workflows inter-applications, la recherche de fichiers, la génération d'images/vidéos et la création de plugins de code.
Disponibilité
Les ordinateurs portables minces (batterie pour toute une journée, écrans haut de gamme) et les ordinateurs de bureau compacts équipés du RTX Spark seront commercialisés cet automne par ASUS, Dell, HP, Lenovo, Microsoft Surface et MSI, avec des modèles Acer et GIGABYTE à suivre.
📖 Lire la source complète : HN AI Agents
👀 See Also

Les startups déclarent dépenser plus en puissance de calcul IA qu'en salaires humains.
Les startups d'IA comme Swan AI déclarent des factures mensuelles de calcul IA dépassant les 113 000 $, leurs PDG décrivant cela comme du 'tokenmaxxing' où les dépenses en IA remplacent les budgets traditionnels d'effectifs.

La bulle IA n'est pas comme la bulle Internet — les travailleurs ne feront pas entrer l'IA en fraude comme ils l'ont fait avec les tableurs
Cory Doctorow soutient que la bulle de l'IA diffère fondamentalement de l'ère dot-com : les travailleurs ont importé clandestinement des outils internet sur les réseaux d'entreprise parce que ces outils les aidaient à faire leur travail. Personne n'importe clandestinement d'agents IA — ils sont imposés par la direction.

Naviguer les essentiels : Les nouveaux utilisateurs recherchent des conseils sur OpenClaw
Les débutants d'OpenClaw sollicitent de l'aide sur Reddit alors qu'ils explorent les subtilités des agents d'IA pour le codage. La communauté technologique intervient avec des conseils et des ressources.

La discussion sur Reddit met en lumière le passage des chatbots aux agents autonomes avec exécution locale.
Un post Reddit distingue les chatbots des agents autonomes en utilisant des exemples concrets et note la tendance vers l'exécution locale avec des modèles comme LLaMA fonctionnant sur des postes de travail privés.