Глубокое погружение в стоимость DeepSeek V4 Flash: объяснение коэффициента попадания в кэш и ценового соотношения

✍️ OpenClawRadar📅 Опубликовано: 7 мая 2026 г.🔗 Source
Глубокое погружение в стоимость DeepSeek V4 Flash: объяснение коэффициента попадания в кэш и ценового соотношения
Ad

Пользователь Reddit проанализировал 922 трассы агентных заданий, выполненных на OpenClaw (с циклом PI-агента) и OpenRouter, сравнив DeepSeek V4 Flash с Opus 4.7. Разница в стоимости ошеломляет: $0,01 за задание для DeepSeek против $1,52 для Opus, несмотря на схожее количество токенов (~962 тыс. в среднем) и вызовов инструментов (~14 в среднем). Соотношение цен составляет 0,0066x, что значительно ниже ожидаемых 0,03x, исходя из цены входных токенов.

Почему DeepSeek дешевле: частота попаданий в кэш и цена чтения/записи

Два фактора объясняют разрыв:

  • Частота попаданий в кэш: DeepSeek V4 Flash достиг 97% против 87% у Opus 4.7. При таких соотношениях цен чтения/записи кэша каждый дополнительный процент попаданий снижает общую стоимость примерно на 20%. Преимущество DeepSeek в 10% сокращает около 2/3 общей стоимости.
  • Соотношение цены чтения/записи кэша: У DeepSeek это соотношение составляет 0,02 (чтение кэша стоит 2% от записи при промахе), тогда как у Opus — 0,08, что сравнимо с OpenAI, Anthropic и Gemini (0,08–0,10). Это само по себе вдвое снижает стоимость.
Ad

Как это суммируется

При схожих количествах токенов и инструментов на задание общая стоимость DeepSeek составляет 0,0066x от стоимости Opus. Пользователь предполагает, что такая эффективность достигнута на уровне инфраструктуры или архитектуры модели (например, лучшая стратегия кэширования). Точный механизм не раскрыт.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Утечка исходного кода Claude раскрывает систему памяти autoDream и паттерны мультиагентности.
Новости

Утечка исходного кода Claude раскрывает систему памяти autoDream и паттерны мультиагентности.

Anthropic случайно опубликовала исходный код TypeScript для Claude Code в source maps npm, раскрыв механизм консолидации памяти autoDream, модульную архитектуру системных промптов и паттерны координации мультиагентов.

OpenClawRadar
$500K AI-фильм 'Hell Grind' компании Higgsfield на самом деле не показывали в Каннах
Новости

$500K AI-фильм 'Hell Grind' компании Higgsfield на самом деле не показывали в Каннах

Higgsfield утверждал, что его фильм за $500 000, созданный ИИ, был показан в Каннах, но организаторы фестиваля подтвердили, что он не входил в официальную программу.

OpenClawRadar
OpenClaw теряет экономически выгодный доступ к моделям GPT и Claude.
Новости

OpenClaw теряет экономически выгодный доступ к моделям GPT и Claude.

Пользователи OpenClaw больше не могут использовать модели Anthropic без оплаты высоких комиссий за API, а OpenAI значительно сократил квоты для Business и Teams аккаунтов до уровня, близкого к бесплатному тарифу, вынуждая пользователей обращаться к китайским или локальным моделям.

OpenClawRadar
Риски судебных разбирательств в структурах финансирования центров обработки данных на основе ИИ
Новости

Риски судебных разбирательств в структурах финансирования центров обработки данных на основе ИИ

Строительство центров обработки данных для ИИ потребует инвестиций в инфраструктуру на сумму 5,2 триллиона долларов к 2030 году. Компании используют сложные финансовые структуры, такие как СПВ и обеспеченные GPU-оборудованием объекты, которые создают девять категорий судебных рисков.

OpenClawRadar