NVIDIA Vera CPU für agentische KI-Workloads gestartet

NVIDIA hat den Vera CPU vorgestellt, einen Prozessor, der speziell für agentische KI und Reinforcement-Learning-Workloads entwickelt wurde. Laut NVIDIA liefert er Ergebnisse mit 50 % schnellerer Leistung und doppelter Effizienz im Vergleich zu herkömmlichen Rack-Scale-CPUs.
Technische Spezifikationen
Der Vera CPU verfügt über 88 benutzerdefinierte, von NVIDIA entwickelte Olympus-Kerne, die jeweils zwei Aufgaben mithilfe von NVIDIA Spatial Multithreading ausführen können. Er umfasst ein Hochbandbreiten-Speichersubsystem auf Basis von LPDDR5X-Speicher und nutzt das NVIDIA Scalable Coherency Fabric der zweiten Generation für schnellere agentische Reaktionen unter hoher Auslastung.
Systemkonfigurationen
- Neues Vera-CPU-Rack integriert 256 flüssigkeitsgekühlte Vera-CPUs
- Unterstützt mehr als 22.500 gleichzeitige CPU-Umgebungen, die unabhängig mit voller Leistung laufen
- Basierend auf der modularen Referenzarchitektur NVIDIA MGX
- Teil der NVIDIA Vera Rubin NVL72-Plattform mit NVIDIA-GPUs, die über die NVIDIA NVLink-C2C-Verbindung verbunden sind
- Bietet 1,8 TB/s kohärente Bandbreite (7-fache PCIe Gen 6-Bandbreite)
- Dient auch als Host-CPU für NVIDIA HGX Rubin NVL8-Systeme
- Systeme integrieren NVIDIA ConnectX SuperNIC-Karten und NVIDIA BlueField-4 DPUs
Übernahme und Partner
Zu den Kunden, die mit NVIDIA zusammenarbeiten, um den Vera CPU einzusetzen, gehören Alibaba, ByteDance, Meta, Oracle Cloud Infrastructure, CoreWeave, Lambda, Nebius und Nscale. Zu den Fertigungspartnern zählen Dell Technologies, HPE, Lenovo, Supermicro, ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron und Wiwynn.
Ziel-Workloads
Vera-Systeme sind für Reinforcement Learning, agentische Inferenz, Datenverarbeitung, Orchestrierung, Speicherverwaltung, Cloud-Anwendungen und High-Performance Computing ausgelegt. Systempartner bieten sowohl Dual- als auch Single-Socket-CPU-Serverkonfigurationen an.
Laut Jensen Huang, CEO von NVIDIA: „Die CPU unterstützt das Modell nicht mehr nur; sie treibt es an. Mit bahnbrechender Leistung und Energieeffizienz ermöglicht Vera KI-Systeme, die schneller denken und weiter skalieren.“
📖 Read the full source: HN AI Agents
👀 Siehe auch

Meta veröffentlicht BOxCrete KI-Modell für Betonmischungsentwurf
Meta hat Bayesian Optimization for Concrete (BOxCrete) veröffentlicht, ein Open-Source-KI-Modell zur Gestaltung nachhaltiger Betonmischungen unter Verwendung von in den USA produzierten Materialien. Das Modell verbessert frühere Versionen durch bessere Robustheit gegenüber Störungen und verbesserte Vorhersagefähigkeiten für das Setzmaß.

OpenClaw's neue Veröffentlichung: Ein einfacher Namenswechsel oder ein großes Upgrade?
OpenClaw, früher bekannt als ClawDBot, hat eine Transformation durchgemacht. Lesen Sie weiter, um herauszufinden, ob diese Änderung lediglich kosmetischer Natur ist oder neue Funktionen und verbesserte Stabilität einführt.

Claude-Code v2.1.78: Plugin-Status, Streaming-Antworten und kritische Fehlerbehebungen
Claude-Code v2.1.78 fügt Plugin-Persistenzzustand mit ${CLAUDE_PLUGIN_DATA} hinzu, ermöglicht zeilenweises Antwort-Streaming und behebt API-Fehler-Schleifen, Berechtigungsumgehungsprobleme und Sandbox-Sicherheitswarnungen.

Anthropic blockiert Claude-Abonnements über Drittanbieter-Tools
Anthropic hat serverseitige Sperren für Claude Pro/Max-Abonnements implementiert, die über Drittanbieter-OAuth-Integrationen genutzt werden, mit der Begründung, dass subventionierter Zugang in großem Maßstab ausgenutzt wurde. Die Richtlinienänderung beinhaltet eine 'Zusätzliche Nutzung'-Abrechnung, die diese Integrationen wirtschaftlich unrentabel macht.