Mercury 2: Диффузионная модель для ИИ-кодирования в реальном времени

Что такое Mercury 2

Mercury 2 — это диффузионная AI-модель, которая генерирует токены параллельно, а не последовательно, используя процесс, уточняющий результат за несколько шагов. Этот подход отличается от традиционных авторегрессивных моделей, которые декодируют токены по одному.

Технические характеристики

Метод генерации: Диффузионная генерация вместо последовательного декодирования токенов
Подход к обработке: Генерирует токены параллельно и уточняет их за несколько шагов
Производительность: Заявленная скорость 1 009 токенов/сек на GPU NVIDIA Blackwell
Тарифы: $0,25 за 1 миллион входных токенов, $0,75 за 1 миллион выходных токенов
Контекстное окно: 128K токенов
Способность к рассуждению: Настраиваемое рассуждение
Интеграция инструментов: Нативное использование инструментов с JSON-выводом, соответствующим схеме
Совместимость API: Совместим с OpenAI API