Проверка цен на DeepSeek V4: кэшированные токены в 178 раз дешевле Opus, но признано отставание в возможностях

DeepSeek V4 вышел с такими низкими ценами, что пользователь Reddit проверил расчеты. Вот подтвержденные цифры:
Разбивка цен
- Стандартный ввод V4-Pro: $0.145 за миллион токенов. Ввод Opus 4.7: ~$5 за миллион. Соотношение: 34x.
- С 75% промо-скидкой (до конца мая): ввод V4-Pro снижается до $0.036 за миллион — в 138 раз дешевле Opus.
- Цены при попадании в кеш: V4-Pro — $0.0036 за миллион. Opus с кешем — $0.625 за миллион. Соотношение: 173x.
Подвох
Как отмечается в исходном посте, DeepSeek признает, что V4 на три-шесть месяцев отстает от GPT-5.4 и Gemini 3.1 Pro по возможностям. Вы не получаете качество уровня frontier, разделенное на 178 — вы получаете качество уровня frontier прошлого лета.
Что это значит для агентных рабочих процессов
Для агентных циклов с интенсивным кешированием (системные промпты, определения инструментов) скидка при попадании в кеш — это главная история. Многократно используемые системные промпты становятся практически бесплатными. Ключевой неизвестный фактор: выдержит ли заявленное контекстное окно в 1M токенов реальные нагрузки или деградирует до приемлемых 200K, как это было замечено у многих моделей с большими окнами.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

RTX 5080 16GB: Qwen3.6 35B MoE при 128k контексте — 56 tok/s, и почему MTP не помогает
Новые бенчмарки показывают, что Qwen3.6 35B MoE на RTX 5080 16GB выдает 56 ток/с при контексте 128k. MTP (Multi-Token Prediction) замедляет работу на 23% из-за нехватки VRAM, вытесняя экспертные слои на CPU.

Сравнение производительности моделей Qwen 3.5 с основными моделями искусственного интеллекта
Сайт для сравнения бенчмарков включает проверенные оценки и сравнительные инфографики для моделей Qwen 3.5 (122B, 35B, 27B, 397B) в сравнении с такими моделями, как GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro и другими.

Выявлены четыре пробела в UX/продукте в процессе адаптации пользователей Claude
Пользователь выявил четыре конкретных пробела в UX/продукте при настройке Claude на Desktop, Cowork, Dispatch и в приложении для iPhone во время активного использования. Проблемы включают: задачи Dispatch входят в бесконечный цикл при отключении десктопа, единственный постоянный поток в Dispatch, панель чата, привязанная к вкладке в Chrome, и отсутствие файлов Google Drive в интерфейсе базы знаний мобильного приложения.

Клод Код v2.1.149: анализ использования, исправления разрешений и навигация с клавиатуры
Claude Code v2.1.149 добавляет разбивку использования по категориям, прокручиваемый с клавиатуры просмотр diff, флажки GFM для списков задач и исправляет обход разрешений PowerShell.