На OpenRouter появились две новые модели, возможно, варианты DeepSeek V4.

На OpenRouter появились две новые модели, которые могут быть пробными версиями DeepSeek V4. Модели называются healer-alpha и hunter-alpha, и их описания указывают на то, что одна из них — облегчённая версия, а другая, по-видимому, полнофункциональная модель.
Характеристики моделей
Полная версия, по сообщениям, имеет 1 ТБ параметров и 1 млн контекста, что соответствует утекшей информации о DeepSeek V4. Облегчённая версия описывается как более лёгкий вариант той же семейства моделей.
Результаты первоначального тестирования
Пользователь провёл ролевые тесты для оценки уровня фильтрации и производительности:
- Обе модели показали впечатляющие результаты в ролевых сценариях
- Ни одна из моделей не отклонила ни одного сообщения во время тестирования
- Облегчённая версия заметно быстрее полной версии
- Полная версия медленнее, но всё же отзывчива
- Обе модели генерируют одинаковое количество токенов менее чем за половину времени по сравнению с GLM 5.0
- Облегчённая версия немного слабее по производительности, но незначительно
- Обе модели сохраняют последовательность персонажей и хорошо справляются с «острым» контентом
Модели в настоящее время находятся в альфа-фазе, что может объяснять отсутствие фильтрации сообщений, наблюдавшееся во время тестирования. Сообщество обсуждает, действительно ли это варианты DeepSeek V4, и делится дополнительными результатами тестирования.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Глубокое погружение в стоимость DeepSeek V4 Flash: объяснение коэффициента попадания в кэш и ценового соотношения
DeepSeek V4 Flash стоит 0,0066x за агентное задание по сравнению с Opus 4,7, благодаря 97% попаданий в кэш и соотношению цены чтения/записи кэша 0,02.

Claude Code 2.1.76 добавляет функцию MCP-запросов, улучшения в работе с рабочими деревьями и исправления, связанные с ограничениями контекста.
Версия Claude Code 2.1.76 добавляет поддержку MCP для структурированного ввода во время задач, включает worktree.sparsePaths для больших монорепозиториев и исправляет ошибки 'Достигнут лимит контекста' в сессиях с 1 млн контекстов. Версия 2.1.75 сделала окна в 1 млн контекстов стандартными для Opus 4.6 на планах Max, Team и Enterprise.

Расширенный DystopiaBench: 42 модели протестированы на 6 типах антиутопий — Claude Opus 4.7 возглавил рейтинг
DystopiaBench добавляет модули Хаксли и Бодрийяра, тестирует 42 модели, включая GPT-5.5, Gemini 3.1 Pro, Grok 4.3 и GLM-5.1. Claude Opus 4.7 последовательно отклоняет вредные запросы на уровнях L4-L5 во всех сценариях, тогда как другие подчиняются начиная с L4 или даже L5.

Anthropic удваивает лимиты скорости Claude Code, подписывает сделку по вычислениям с SpaceX
Лимиты Claude Code на пять часов удвоены для планов Pro/Max/Team/Enterprise, убрано снижение в часы пик, а для моделей Opus повышены лимиты API. SpaceX Colossus 1 добавляет более 300 МВт мощности (220 тыс. GPU NVIDIA) в течение месяца.