Mémoire représente maintenant 63% du coût des puces IA : les dépenses HBM atteignent 32 milliards de dollars

La dernière analyse d'Epoch AI révèle que la mémoire à large bande passante (HBM) représente désormais près des deux tiers du coût des composants des puces IA. Entre le T1 2024 et le T4 2025, la part de HBM est passée de 52 % à 63 % sur les puces conçues par Nvidia, AMD, Google et Amazon, pondérées par le volume de production. La dépense totale en composants pour les puces IA est passée de 22 milliards de dollars en 2024 à 52 milliards de dollars en 2025, HBM contribuant à elle seule à 20 milliards de cette augmentation.
Chiffres clés
- Mémoire (HBM) : part de 52 % → 63 %. Dépense absolue passée d'environ 12 milliards de dollars (2024) à 32 milliards (2025).
- Puces logiques : part quasi stable, autour de 13–14 %.
- Packaging avancé (CoWoS) : part passée de 19 % à 15 %.
- Composants auxiliaires : part passée de 15 % à 9 %.
Pourquoi c'est important
La mémoire est désormais le principal facteur de coût dans les accélérateurs IA. Epoch modélise les coûts par puce à partir de rapports financiers, de déclarations de fournisseurs et d'analyses sectorielles dans quatre catégories : les piles HBM (HBM3, HBM3e), les puces logiques sur nœud avancé (3–5 nm), le packaging CoWoS de TSMC et les composants auxiliaires (substrat, alimentation). Ce changement est dû à une offre de mémoire tendue et à la hausse des prix HBM. Les hyperscalers intègrent déjà cela dans leurs prévisions de dépenses d'investissement : Microsoft prévoit 190 milliards de dollars pour l'exercice 2026, dont environ 25 milliards liés à la hausse des prix des composants ; Meta a relevé de 10 milliards de dollars sa fourchette de dépenses d'investissement 2026 pour la même raison.
Plages d'incertitude
Epoch fournit des intervalles de confiance à 90 % et deux métriques limites :
- Fourchette basée uniquement sur le coût de la mémoire : 60–67 % au T4 2025.
- Fourchette avec tous les composants aux extrêmes : 54–73 % au T4 2025.
La tendance suggère que la part de la mémoire continuera de croître en 2026, car l'offre de HBM reste limitée.
📖 Lire la source complète : HN AI Agents
👀 See Also

Anthropic lance Claude Code Channels pour l'intégration de messagerie
Anthropic a lancé Claude Code Channels, permettant aux développeurs d'envoyer des messages directs aux sessions Claude Code depuis Telegram ou Discord avec un accès complet aux outils incluant les modifications de fichiers, les exécutions de tests et les opérations git. Cette fonctionnalité nécessite un plan Anthropic payant et prend en charge deux plateformes, contre plus de 20 pour OpenClaw.

Publication Reddit critique les flux de travail des agents PDG virtuels, prône une approche basée sur les compétences
Un post Reddit sur r/openclaw critique la création d'agents IA avec des titres de poste comme 'développeur backend' ou 'growth hacker' comme une surcharge inutile, proposant plutôt de regrouper les capacités en compétences réutilisables qui peuvent être appelées en cas de besoin.

OpenRouter Confirme que les Modèles Alpha Hunter/Healer sont des Variantes de MiMo V2
Les modèles Hunter Alpha et Healer Alpha d'OpenRouter, précédemment furtifs, ont été confirmés comme étant des variantes de MiMo V2. Hunter Alpha est le modèle de raisonnement textuel uniquement MiMo V2 Pro avec une fenêtre de contexte de 1M, tandis que Healer Alpha est le modèle de raisonnement textuel+image MiMo V2 Omni avec une fenêtre de contexte de 262K.

Promotion d'utilisation de mars d'Anthropic : Comment les heures creuses doublent les limites de Claude
Anthropic propose une promotion d'utilisation hors pointe multipliée par deux jusqu'au 27 mars, où Claude considère l'utilisation consommée comme moitié pendant les heures spécifiées, doublant effectivement votre limite de 5 heures. La promotion fonctionne en divisant par deux la manière dont la consommation est comptabilisée plutôt que de fournir un pool d'utilisation séparé.