NVIDIA、エージェントAIワークロード向け「Vera CPU」を発表

NVIDIAは、エージェント型AIと強化学習ワークロード向けに特別に構築されたプロセッサ「Vera CPU」を発表しました。NVIDIAによると、従来のラックスケールCPUと比較して、50%高速な性能と2倍の効率性で結果を提供します。
技術仕様
Vera CPUは、NVIDIA独自設計の88個のOlympusコアを搭載しており、各コアはNVIDIA Spatial Multithreadingを使用して2つのタスクを実行可能です。LPDDR5Xメモリを基盤とした高帯域幅メモリサブシステムを備え、第2世代NVIDIA Scalable Coherency Fabricを採用することで、高負荷条件下でのエージェント応答を高速化します。
システム構成
- 新しいVera CPUラックは、256個の液体冷却Vera CPUを統合
- 22,500以上の同時CPU環境をフル性能で独立して維持可能
- NVIDIA MGXモジュラーリファレンスアーキテクチャを使用して構築
- NVIDIA NVLink-C2CインターコネクトでNVIDIA GPUと接続されたNVIDIA Vera Rubin NVL72プラットフォームの一部
- 1.8 TB/sのコヒーレント帯域幅を提供(PCIe Gen 6帯域幅の7倍)
- NVIDIA HGX Rubin NVL8システムのホストCPUとしても機能
- システムはNVIDIA ConnectX SuperNICカードとNVIDIA BlueField-4 DPUを統合
採用とパートナー
Vera CPUの導入でNVIDIAと協力している顧客には、Alibaba、ByteDance、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius、Nscaleが含まれます。製造パートナーには、Dell Technologies、HPE、Lenovo、Supermicro、ASUS、Compal、Foxconn、GIGABYTE、Pegatron、Quanta Cloud Technology (QCT)、Wistron、Wiwynnが含まれます。
対象ワークロード
Veraシステムは、強化学習、エージェント推論、データ処理、オーケストレーション、ストレージ管理、クラウドアプリケーション、高性能コンピューティング向けに設計されています。システムパートナーは、デュアルソケットとシングルソケットのCPUサーバー構成の両方を提供します。
NVIDIAのCEOであるジェンセン・フアンは次のように述べています。「CPUはもはや単にモデルをサポートするものではなく、それを駆動するものです。画期的な性能とエネルギー効率により、Veraはより速く思考し、さらに拡張可能なAIシステムを実現します。」
📖 Read the full source: HN AI Agents
👀 See Also

Anthropic、Claude Codeの使用制限を2倍に引き上げ、SpaceXと計算リソース契約を締結
AnthropicはClaude Code ProおよびMaxサブスクライバーの5時間使用枠を倍増させ、ピーク時の制限を撤廃し、OpusのAPI制限を引き上げました。これはSpaceXとの新たな契約により、Colossus 1スーパーコンピューター(22万基以上のNVIDIA GPU)から300 MW以上の計算能力を確保したためです。

Claude Codeの約12,000トークンの強制システムプロンプトの分析がユーザー設定を上書きする優先ルールを明らかに
Claude Codeに注入されている約12Kトークンのシステムプロンプトの分析により、歌詞禁止、サブエージェント委任、簡潔さの優先ルールが、ユーザー定義のCLAUDE.mdやメモリファイルを上書きすることが明らかになった。

SDNY判決、AIチャット通信に弁護士・依頼者特権を認めず
ラコフ判事は、米国対ヘプナー事件において、ChatGPTのようなAIツールとのコミュニケーションは弁護士・依頼者特権の対象にはならず、AI生成の法的作業のすべてを開示する必要があると裁定しました。裁判所は、特権保護に必要な人間同士の機密性がAIには欠けていると判断しました。

オンタリオ州の監査:AI書記システムの60%が薬剤を混同、85%が精神保健の詳細を見逃す
オンタリオ州の監査官が調べたところ、20のAI書記システムのうち12件が誤った薬剤情報を挿入し、9件が治療提案を捏造し、17件が医師と患者の録音から精神保健の重要事項を見逃していた。評価では正確性の重みは総合点のわずか4%だった。