DeepSeek V4 Pro: Цены на кэш в 178 раз ниже Opus

DeepSeek V4 вышел с такими низкими ценами, что пользователь Reddit проверил расчеты. Вот подтвержденные цифры:

Разбивка цен

Стандартный ввод V4-Pro: $0.145 за миллион токенов. Ввод Opus 4.7: ~$5 за миллион. Соотношение: 34x.
С 75% промо-скидкой (до конца мая): ввод V4-Pro снижается до $0.036 за миллион — в 138 раз дешевле Opus.
Цены при попадании в кеш: V4-Pro — $0.0036 за миллион. Opus с кешем — $0.625 за миллион. Соотношение: 173x.

Подвох

Как отмечается в исходном посте, DeepSeek признает, что V4 на три-шесть месяцев отстает от GPT-5.4 и Gemini 3.1 Pro по возможностям. Вы не получаете качество уровня frontier, разделенное на 178 — вы получаете качество уровня frontier прошлого лета.

Что это значит для агентных рабочих процессов

Для агентных циклов с интенсивным кешированием (системные промпты, определения инструментов) скидка при попадании в кеш — это главная история. Многократно используемые системные промпты становятся практически бесплатными. Ключевой неизвестный фактор: выдержит ли заявленное контекстное окно в 1M токенов реальные нагрузки или деградирует до приемлемых 200K, как это было замечено у многих моделей с большими окнами.

📖 Read the full source: r/LocalLLaMA

Проверка цен на DeepSeek V4: кэшированные токены в 178 раз дешевле Opus, но признано отставание в возможностях

Разбивка цен

Подвох

Что это значит для агентных рабочих процессов

👀 Смотрите также

RTX 5080 16GB: Qwen3.6 35B MoE при 128k контексте — 56 tok/s, и почему MTP не помогает

Сравнение производительности моделей Qwen 3.5 с основными моделями искусственного интеллекта

Выявлены четыре пробела в UX/продукте в процессе адаптации пользователей Claude

Клод Код v2.1.149: анализ использования, исправления разрешений и навигация с клавиатуры