Меркурий 2: Модель на основе диффузии для кодирования с ИИ в реальном времени

Что такое Mercury 2
Mercury 2 — это диффузионная AI-модель, которая генерирует токены параллельно, а не последовательно, используя процесс, уточняющий результат за несколько шагов. Этот подход отличается от традиционных авторегрессивных моделей, которые декодируют токены по одному.
Технические характеристики
- Метод генерации: Диффузионная генерация вместо последовательного декодирования токенов
- Подход к обработке: Генерирует токены параллельно и уточняет их за несколько шагов
- Производительность: Заявленная скорость 1 009 токенов/сек на GPU NVIDIA Blackwell
- Тарифы: $0,25 за 1 миллион входных токенов, $0,75 за 1 миллион выходных токенов
- Контекстное окно: 128K токенов
- Способность к рассуждению: Настраиваемое рассуждение
- Интеграция инструментов: Нативное использование инструментов с JSON-выводом, соответствующим схеме
- Совместимость API: Совместим с OpenAI API
Целевые сценарии использования
Разработчики позиционируют Mercury 2 для:
- Помощников по программированию
- Агентских циклов (многошаговые цепочки логического вывода)
- Систем реального времени для голоса
- RAG/поисковых конвейеров с многоуровневым извлечением
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Claude Opus 4.6 блокирует рабочий процесс соревнования Kaggle для проверки кода.
Разработчик сообщает, что Claude Opus 4.6 теперь блокирует законные рабочие процессы Kaggle-соревнований, где Claude проверяет цепочки рассуждений для валидации данных обучения SFT. Пользователь работал над соревнованием NVIDIA Nemotron Reasoning Challenge, когда фильтры безопасности отметили примеры шифра замены.

Утечка кода Claude раскрывает систему KAIROS и пробел в верификации ИИ-агентов
Утечка карты исходного кода Claude Code показала 512 тысяч строк TypeScript, 44 флажка функций и KAIROS — фоновый агент, который консолидирует память в периоды простоя. Независимый разработчик создал аналогичный демон для объединения сессий в многодневные кампании, но обнаружил, что успешная компиляция не гарантирует работоспособность кода.

Политика Википедии в отношении ИИ: Запрет на использование LLM для создания статей, исключения для редактирования и перевода
Википедия запрещает использование LLM для создания или переписывания статей, за узкими исключениями для базовой корректуры и перевода. Нарушения могут привести к быстрому удалению (G15) и удалению AI-сгенерированных комментариев со страниц обсуждения.

Мета-хакатон OpenEnv AI в Индии предлагает прямые собеседования и призовой фонд в 30 000 долларов.
Meta проводит первый в Индии OpenEnv AI Hackathon в сотрудничестве с Hugging Face и PyTorch, где разработчики создают среды обучения с подкреплением для ИИ-агентов. Лучшие команды получают прямые собеседования с командами Meta и Hugging Face, а также призовой фонд в размере $30 000.