HBM-Ausgaben erreichen 32 Milliarden Dollar: Speicher macht jetzt 63% der KI-Chip-Kosten aus

Die neueste Analyse von Epoch AI zeigt, dass High-Bandwidth Memory (HBM) inzwischen fast zwei Drittel der Komponentenkosten von KI-Chips ausmacht. Zwischen Q1 2024 und Q4 2025 stieg der Anteil von HBM von 52 % auf 63 % bei Chips, die von Nvidia, AMD, Google und Amazon entwickelt wurden, gewichtet nach Produktionsvolumen. Die Gesamtausgaben für Komponenten von KI-Chips wuchsen von 22 Milliarden Dollar im Jahr 2024 auf 52 Milliarden Dollar im Jahr 2025, wobei HBM allein 20 Milliarden Dollar dieses Anstiegs ausmacht.
Wichtige Zahlen
- Speicher (HBM): Anteil von 52 % auf 63 %. Absolute Ausgaben stiegen von ~12 Mrd. $ (2024) auf 32 Mrd. $ (2025).
- Logik-Dies: Etwa stabil bei 13–14 % Anteil.
- Fortschrittliche Verpackung (CoWoS): Fiel von 19 % auf 15 % Anteil.
- Hilfskomponenten: Fielen von 15 % auf 9 % Anteil.
Warum es wichtig ist
Speicher ist jetzt der dominierende Kostenfaktor bei KI-Beschleunigern. Epoch modelliert die Kosten pro Chip aus Finanzberichten, Lieferantenangaben und Analystenberichten in vier Kategorien: HBM-Stapel (HBM3, HBM3e), Logik-Dies auf fortgeschrittenen Knoten (3–5 nm), TSMC-CoWoS-Verpackung und Hilfskomponenten (Substrat, Stromversorgung). Der Wandel wird durch ein knappes Speicherangebot und steigende HBM-Preise angetrieben. Hyperscaler berücksichtigen dies bereits in ihren Investitionsplänen: Microsofts Investitionsausblick von 190 Mrd. $ für das Geschäftsjahr 2026 umfasst ~25 Mrd. $ durch höhere Komponentenpreise; Meta hat seine Investitionsspanne für 2026 um 10 Mrd. $ erhöht und nannte denselben Faktor.
Unsicherheitsspannen
Epoch gibt 90%-Konfidenzintervalle und zwei Grenzwerte an:
- Spanne allein aus Speicherkosten: 60–67 % im Q4 2025.
- Spanne mit allen Komponenten an Extremen: 54–73 % im Q4 2025.
Der Trend deutet darauf hin, dass der Speicheranteil 2026 weiter steigen wird, da das HBM-Angebot begrenzt bleibt.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

Claude-Code v2.1.84 fügt PowerShell-Tool, Umgebungsvariablen und mehrere Fehlerbehebungen hinzu
Claude-Code v2.1.84 stellt ein PowerShell-Tool für Windows als Opt-in-Vorschau vor, fügt Umgebungsvariablen für Modellkonfiguration und Streaming-Timeout hinzu und enthält zahlreiche Fehlerbehebungen und Leistungsverbesserungen.

NVIDIA veröffentlicht Nemotron-3-Ultra-550B: 55B aktive Parameter, 1M Kontext, LatentMoE Hybrid
NVIDIA hat Nemotron-3-Ultra-550B-A55B-BF16 veröffentlicht, ein Modell mit 550B Parametern (55B aktiv), 1M Token Kontext, hybrider LatentMoE-Architektur (Mamba-2 + MoE + Attention + MTP) und konfigurierbarem Reasoning.

Agenteninfrastruktur für KMU-Betriebe: Ein Whitepaper eines QSR-Betreibers, der zum Entwickler wurde
Ein 16-jähriger QSR-Betreiber veröffentlichte ein Whitepaper, das für eine fehlende Infrastrukturschicht zwischen generischem AI-Chat und vertikalen SaaS-Dashboards argumentiert, mit 8 Skills auf ClawHub, über 1.500 Downloads und einer Live-Bereitstellung außerhalb des QSR.

Entwickler-Erfahrung mit Claude AI: Vom Denkpartner zum kognitiven Outsourcing
Ein Entwickler teilt eine 8-monatige Erfahrung mit der täglichen Nutzung von Claude AI und bemerkt einen Wandel: von der Verwendung zur Verfeinerung bestehender Gedanken hin zum vollständigen Auslagern des anfänglichen Denkens. Der Beitrag beschreibt zwei verschiedene kognitive Ansätze: KI als Denkpartner versus KI als Erstentwurfs-Generator.