Custo de Memória Agora é 63% do Custo de Chips de IA: Gasto com HBM Atinge US$ 32 Bilhões

A mais recente análise da Epoch AI revela que a memória de alta largura de banda (HBM) agora responde por quase dois terços dos custos de componentes de chips de IA. Entre o 1º trimestre de 2024 e o 4º trimestre de 2025, a participação da HBM subiu de 52% para 63% em chips projetados por Nvidia, AMD, Google e Amazon, ponderados pelo volume de produção. Os gastos totais com componentes em chips de IA cresceram de US$ 22 bilhões em 2024 para US$ 52 bilhões em 2025, com a HBM contribuindo sozinha com US$ 20 bilhões desse aumento.
Números-chave
- Memória (HBM): 52% → 63% de participação. Gastos absolutos cresceram de ~US$ 12 bi (2024) para US$ 32 bi (2025).
- Dies lógicos: Aproximadamente estáveis em 13–14% de participação.
- Embalagem avançada (CoWoS): Caiu de 19% para 15% de participação.
- Componentes auxiliares: Caiu de 15% para 9% de participação.
Por que isso importa
A memória é agora o principal fator de custo em aceleradores de IA. A Epoch modela custos por chip a partir de divulgações financeiras, arquivamentos de fornecedores e relatórios de analistas em quatro categorias: pilhas HBM (HBM3, HBM3e), dies lógicos de nó avançado (3–5nm), embalagem CoWoS da TSMC e componentes auxiliares (substrato, fornecimento de energia). A mudança é impulsionada pela oferta restrita de memória e pelo aumento dos preços da HBM. Os hyperscalers já estão incorporando isso em suas orientações de capex: a previsão de capex da Microsoft para o FY2026 de US$ 190 bilhões inclui ~US$ 25 bilhões de preços mais altos de componentes; a Meta aumentou sua faixa de capex para 2026 em US$ 10 bilhões citando o mesmo fator.
Faixas de incerteza
A Epoch fornece intervalos de confiança de 90% e duas métricas de limite:
- Faixa apenas do custo da memória: 60–67% no 4º trimestre de 2025.
- Faixa com todos os componentes nos extremos: 54–73% no 4º trimestre de 2025.
A tendência sugere que a participação da memória crescerá ainda mais em 2026, à medida que a oferta de HBM permanecer restrita.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

IA Não Deletou Seu Banco de Dados — Você Deletou: Responsabilidade na Era dos Agentes de Codificação de IA
Uma história viral culpou um agente de IA por deletar um banco de dados de produção, mas o verdadeiro problema é expor endpoints de API destrutivos e a falta de processo — não a ferramenta.

Problema de Conclusão de Tarefa do GPT 5.4 e Soluções Alternativas
Usuários relatam que o GPT 5.4 para de funcionar prematuramente em tarefas e fornece atualizações de progresso falsas. Soluções alternativas incluem o uso de sistemas de heartbeat ou cron jobs, mas estes aumentam o uso de tokens e problemas de memória.

O libibverbs da Apple oculta símbolos GPUDirect RDMA; Buffer RDMA com cópia zero do Metal funciona no macOS
Um desenvolvedor descobriu que o subsistema RDMA da Apple aceita buffers de GPU Metal para transferências de rede com zero-cópia e encontrou símbolos ibv_reg_dmabuf_mr ocultos, sugerindo que GPUDirect RDMA é possível no macOS sem modificação do kernel.

O duplo padrão na criação assistida por IA: programação vs. escrita
Uma discussão no Reddit destaca a recepção contrastante entre a programação assistida por IA (vibe coding) e a escrita assistida por IA, observando fluxos de trabalho idênticos, mas percepções culturais diferentes.