DeepSeek V4: Новые модели на OpenRouter

На OpenRouter появились две новые модели, которые могут быть пробными версиями DeepSeek V4. Модели называются healer-alpha и hunter-alpha, и их описания указывают на то, что одна из них — облегчённая версия, а другая, по-видимому, полнофункциональная модель.

Характеристики моделей

Полная версия, по сообщениям, имеет 1 ТБ параметров и 1 млн контекста, что соответствует утекшей информации о DeepSeek V4. Облегчённая версия описывается как более лёгкий вариант той же семейства моделей.

Результаты первоначального тестирования

Пользователь провёл ролевые тесты для оценки уровня фильтрации и производительности:

Обе модели показали впечатляющие результаты в ролевых сценариях
Ни одна из моделей не отклонила ни одного сообщения во время тестирования
Облегчённая версия заметно быстрее полной версии
Полная версия медленнее, но всё же отзывчива
Обе модели генерируют одинаковое количество токенов менее чем за половину времени по сравнению с GLM 5.0
Облегчённая версия немного слабее по производительности, но незначительно
Обе модели сохраняют последовательность персонажей и хорошо справляются с «острым» контентом

Модели в настоящее время находятся в альфа-фазе, что может объяснять отсутствие фильтрации сообщений, наблюдавшееся во время тестирования. Сообщество обсуждает, действительно ли это варианты DeepSeek V4, и делится дополнительными результатами тестирования.

📖 Read the full source: r/LocalLLaMA

На OpenRouter появились две новые модели, возможно, варианты DeepSeek V4.

Характеристики моделей

Результаты первоначального тестирования

👀 Смотрите также

Zig项目关于严格反LLM贡献政策的理由

Выбор лучшего поставщика токенов для ваших потребностей в API

Самообучаемая точная настройка на собственных ошибках повышает качество малых моделей до 80% на HumanEval

Anthropic разделяет подписки на Claude от использования сторонних инструментов.