Проверка цен на DeepSeek V4: кэшированные токены в 178 раз дешевле Opus, но признано отставание в возможностях

✍️ OpenClawRadar📅 Опубликовано: 29 апреля 2026 г.🔗 Source
Проверка цен на DeepSeek V4: кэшированные токены в 178 раз дешевле Opus, но признано отставание в возможностях
Ad

DeepSeek V4 вышел с такими низкими ценами, что пользователь Reddit проверил расчеты. Вот подтвержденные цифры:

Разбивка цен

  • Стандартный ввод V4-Pro: $0.145 за миллион токенов. Ввод Opus 4.7: ~$5 за миллион. Соотношение: 34x.
  • С 75% промо-скидкой (до конца мая): ввод V4-Pro снижается до $0.036 за миллион — в 138 раз дешевле Opus.
  • Цены при попадании в кеш: V4-Pro — $0.0036 за миллион. Opus с кешем — $0.625 за миллион. Соотношение: 173x.

Подвох

Как отмечается в исходном посте, DeepSeek признает, что V4 на три-шесть месяцев отстает от GPT-5.4 и Gemini 3.1 Pro по возможностям. Вы не получаете качество уровня frontier, разделенное на 178 — вы получаете качество уровня frontier прошлого лета.

Что это значит для агентных рабочих процессов

Для агентных циклов с интенсивным кешированием (системные промпты, определения инструментов) скидка при попадании в кеш — это главная история. Многократно используемые системные промпты становятся практически бесплатными. Ключевой неизвестный фактор: выдержит ли заявленное контекстное окно в 1M токенов реальные нагрузки или деградирует до приемлемых 200K, как это было замечено у многих моделей с большими окнами.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

RTX 5080 16GB: Qwen3.6 35B MoE при 128k контексте — 56 tok/s, и почему MTP не помогает
Новости

RTX 5080 16GB: Qwen3.6 35B MoE при 128k контексте — 56 tok/s, и почему MTP не помогает

Новые бенчмарки показывают, что Qwen3.6 35B MoE на RTX 5080 16GB выдает 56 ток/с при контексте 128k. MTP (Multi-Token Prediction) замедляет работу на 23% из-за нехватки VRAM, вытесняя экспертные слои на CPU.

OpenClawRadar
Сравнение производительности моделей Qwen 3.5 с основными моделями искусственного интеллекта
Новости

Сравнение производительности моделей Qwen 3.5 с основными моделями искусственного интеллекта

Сайт для сравнения бенчмарков включает проверенные оценки и сравнительные инфографики для моделей Qwen 3.5 (122B, 35B, 27B, 397B) в сравнении с такими моделями, как GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro и другими.

OpenClawRadar
Выявлены четыре пробела в UX/продукте в процессе адаптации пользователей Claude
Новости

Выявлены четыре пробела в UX/продукте в процессе адаптации пользователей Claude

Пользователь выявил четыре конкретных пробела в UX/продукте при настройке Claude на Desktop, Cowork, Dispatch и в приложении для iPhone во время активного использования. Проблемы включают: задачи Dispatch входят в бесконечный цикл при отключении десктопа, единственный постоянный поток в Dispatch, панель чата, привязанная к вкладке в Chrome, и отсутствие файлов Google Drive в интерфейсе базы знаний мобильного приложения.

OpenClawRadar
Клод Код v2.1.149: анализ использования, исправления разрешений и навигация с клавиатуры
Новости

Клод Код v2.1.149: анализ использования, исправления разрешений и навигация с клавиатуры

Claude Code v2.1.149 добавляет разбивку использования по категориям, прокручиваемый с клавиатуры просмотр diff, флажки GFM для списков задач и исправляет обход разрешений PowerShell.

OpenClawRadar