Сравнение текущих затрат на LLM: Deepseek, Qwen, MiniMax против OpenAI

Сравнение цен по провайдерам
Вот текущее сравнение стоимости среди основных провайдеров LLM на основе недавнего анализа Reddit. Все цены указаны в долларах США за 1 миллион токенов и актуальны на дату анализа.
- Deepseek-V3.2: $0,26 вход / $0,38 выход. Это примерно в 10 раз дешевле GPT-4, при этом тесты показывают производительность уровня GPT-5.
- Серия Qwen3.5: Модель 27B стоит $0,26 вход / $2,60 выход, обеспечивая качество, сравнимое с Claude, за долю стоимости. Серия предлагает гибкость от 0,8B до 397TB параметров, каждая версия поддерживает контекстные окна 262k, расширяемые до 1M+, и встроенный режим мышления.
- MiniMax-M2.5: $0,27 вход / $0,95 выход. Отлично подходит для рабочих процессов программирования с 80,2% на SWE bench verified, что делает его выдающимся для агентных задач кодирования.
- OpenAI GPT-4.1: $2,00 вход / $8,00 выход. Хотя, безусловно, мощная модель, ценовая премия трудно оправдана для высоконагруженных производственных сценариев, когда альтернативы показывают сравнимую производительность.
Ключевой технический контекст
Анализ включает оценки LMSYS ELO, где они доступны, поскольку большинство других тестов в настоящее время оптимизированы. Ёмкость контекстного окна становится всё более важной, большинство современных моделей поддерживают 200k+ токенов как стандарт, что принципиально меняет подход к структурированию приложений вокруг длинных документов и расширенных диалогов.
Для разработчиков, использующих AI-агентов для программирования, эти различия в цене значительны при рассмотрении затрат на производственное развёртывание. Данные показывают, что альтернативы премиальным моделям, таким как GPT-4, могут обеспечить сравнимую производительность при существенно более низких затратах, особенно для высоконагруженных сценариев.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Пользователи Claude систематически исключены из исследований по психологии ИИ – методологический пробел
Обзор десятков психологических статей об использовании ИИ-чатботов показывает, что пользователи Claude никогда не выделяются как отдельная группа, несмотря на принципиально разные профили использования и дизайн модели по сравнению с пользователями ChatGPT, Character.AI или Replika.

Критика границ абстракции и подхода к интеграции сервисов в MCP
Обсуждение на Reddit критикует MCP за объединение доступа к API, эффективных инструментов и предметных знаний в один слой, утверждая, что это создаёт ограниченные интерфейсы по сравнению с базовыми API. В посте в качестве примера приводится Lattice, чей публичный API охватывает только рабочие процессы HR-администрирования, несмотря на наличие полного GraphQL API.

NHS England отказывается от открытого исходного кода: открытое письмо призывает отменить политику SDLC-8
Открытое письмо с 74 подписями призывает NHS England отозвать SDLC-8 — политику, скрывающую весь исходный код NHS — и подтвердить Принцип 12 Стандарта обслуживания NHS: «Делать новый исходный код открытым».

Обновления системного промпта Claude Code 2.1.72: новые режимы выполнения и улучшения проверки
Версия Claude Code 2.1.72 представляет новые системные промпты для Авторежима (непрерывное выполнение задач) и Краткого режима (выполнение в стиле Codex), а также значительное расширение возможностей агента-специалиста по верификации с документированными паттернами сбоев и требованиями к структурированному выводу.