NVIDIA представила процессор Vera для агентных задач искусственного интеллекта

NVIDIA представила процессор Vera CPU, специально созданный для агентного ИИ и задач обучения с подкреплением. По данным NVIDIA, он обеспечивает результаты с производительностью на 50% выше и вдвое большей эффективностью по сравнению с традиционными процессорами для стоечных систем.
Технические характеристики
Процессор Vera CPU оснащён 88 пользовательскими ядрами Olympus собственной разработки NVIDIA, каждое из которых способно выполнять две задачи с использованием технологии NVIDIA Spatial Multithreading. Он включает в себя высокопроизводительную подсистему памяти на основе LPDDR5X и использует масштабируемую когерентную структуру NVIDIA второго поколения для более быстрых агентных ответов в условиях высокой нагрузки.
Конфигурации систем
- Новая стойка с процессорами Vera CPU объединяет 256 жидкостных процессоров Vera CPU
- Поддерживает более 22 500 параллельных сред CPU, работающих независимо на полной производительности
- Создана с использованием модульной эталонной архитектуры NVIDIA MGX
- Является частью платформы NVIDIA Vera Rubin NVL72 с графическими процессорами NVIDIA, соединёнными через интерконнект NVIDIA NVLink-C2C
- Обеспечивает 1,8 ТБ/с когерентной пропускной способности (в 7 раз больше пропускной способности PCIe Gen 6)
- Также служит хост-процессором для систем NVIDIA HGX Rubin NVL8
- Системы интегрируют карты NVIDIA ConnectX SuperNIC и процессоры данных NVIDIA BlueField-4 DPU
Внедрение и партнёры
Клиенты, сотрудничающие с NVIDIA для внедрения процессора Vera CPU, включают Alibaba, ByteDance, Meta, Oracle Cloud Infrastructure, CoreWeave, Lambda, Nebius и Nscale. Партнёры по производству включают Dell Technologies, HPE, Lenovo, Supermicro, ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron и Wiwynn.
Целевые задачи
Системы Vera предназначены для обучения с подкреплением, агентного вывода, обработки данных, оркестрации, управления хранением, облачных приложений и высокопроизводительных вычислений. Партнёры по системам предоставляют как двухсокетные, так и односокетные конфигурации серверов с процессорами CPU.
По словам Дженсена Хуанга, генерального директора NVIDIA: «Процессор больше не просто поддерживает модель; он управляет ею. Благодаря прорывной производительности и энергоэффективности, Vera открывает возможности для ИИ-систем, которые думают быстрее и масштабируются дальше.»
📖 Read the full source: HN AI Agents
👀 Смотрите также

Определение ИИ-агентов: Тест на работоспособность
Обсуждение на Reddit ставит под сомнение, являются ли многие продукты с ИИ-агентами по сути чат-ботами со списком задач, предлагая тест, основанный на их способности выполнять рабочие процессы в нескольких инструментах без ручного вмешательства.

Открытие новых возможностей: использование Claude Max с Opus 4.6 в качестве API
Откройте для себя творческий подход к использованию подписок Claude Max как API, совместимых с Opus 4.6, который был рассмотрен энтузиастами технологий в сообществе.

Uber сжигает бюджет на ИИ 2026 года за 4 месяца на Claude Code — $500–2 тыс. на инженера в месяц
Uber потратил весь свой AI-бюджет на 2026 год уже к апрелю на Claude Code и Cursor. Ежемесячные затраты на API достигли $500–$2000 на одного инженера. 95% инженеров используют AI-инструменты ежемесячно; 70% всего закоммиченного кода создано с помощью AI.
FairyFuse достигает 29,6-кратного ускорения ядра на ЦП с помощью безумножительного вывода с тройными весами
FairyFuse объединяет восемь вещественных суб-GEMV в один цикл AVX-512 с использованием маскированных сложений/вычитаний, обеспечивая 32,4 токена/с на Xeon 8558P и ускорение в 1,24 раза по сравнению с llama.cpp Q4_K_M при почти без потерь качестве.