Анализ: Фактические вычислительные затраты Anthropic для пользователей Claude Code значительно ниже заявленной суммы в $5 тыс.

Недавняя статья Forbes утверждала, что план Claude Code Max от Anthropic стоимостью $200 в месяц может потреблять около $5000 на вычисления, предполагая, что компания теряет деньги на инференсе. Этот анализ рассматривает, почему эта цифра вводит в заблуждение.
Ценообразование API против фактических затрат на вычисления
Цифра в $5000 происходит из розничного ценообразования API Anthropic: $5 за миллион входных токенов и $25 за миллион выходных токенов для Opus 4.6. По этим ценам активный пользователь действительно может набрать $5000 в месяц в эквивалентном использовании API.
Однако ценообразование API не отражает реальную стоимость, которую Anthropic несёт за обслуживание этих токенов. Чтобы оценить фактические затраты на инференс, посмотрите на конкурентные цены для аналогичных моделей на OpenRouter:
- Qwen 3.5 397B-A17B (сопоставим с Opus 4.6): $0.39 за миллион входных токенов, $2.34 за миллион выходных токенов
- Kimi K2.5 1T параметров с 32B активными: $0.45 за миллион входных токенов, $2.25 за миллион выходных токенов
- Чтения кэша DeepInfra на Kimi K2.5: $0.07/MTok против $0.50/MTok у Anthropic
Реальная математика
Эти провайдеры OpenRouter ведут бизнес с маржой, а не несут огромные убытки. Если они могут обслуживать сопоставимые модели примерно за 10% от цены API Anthropic, фактические затраты на вычисления, вероятно, находятся в этом диапазоне.
Следовательно:
- Активный пользователь, потребляющий $5000 в эквивалентных API токенах ≈ $500 фактических затрат на вычисления
- Убыток на экстремальных пользователях: $300 в месяц (а не $4800)
- Большинство пользователей не приближаются к лимитам: Anthropic заявляет, что менее 5% подписчиков будут затронуты еженедельными ограничениями
- Типичное использование плана Max 20x составляет около 50% от еженедельного бюджета токенов ≈ безубыточность или прибыльность для Anthropic
Кто на самом деле сталкивается с затратами в $5000?
Цифра в $5000 происходит из внутреннего анализа Cursor. Для Cursor эта цифра примерно верна, потому что они платят розничные цены API Anthropic (или близкие к ним) за доступ к Opus 4.6.
Разработчики хотят видеть модели Anthropic в Cursor из-за узнаваемости бренда и текущих преимуществ в производительности по сравнению с более дешёвыми открытыми альтернативами.
Более широкие последствия
Anthropic в целом не прибыльна из-за затрат на обучение, зарплат исследователей и обязательств по вычислениям — а не из-за инференса. В расчёте на одного пользователя и один токен для инференса, Anthropic, вероятно, прибыльна в среднем на подписчиках Claude Code.
Нарратив «ИИ-инференс — это финансовая яма» играет на руку передовым лабораториям, препятствуя конкуренции и делая их рвы более глубокими, чем они есть на самом деле.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Снижение соответствия системному промпту Claude в длинных беседах
Агенты на основе Claude демонстрируют снижение соблюдения системных промптов после 40-50 сообщений, игнорируя правила форматирования и забывая ограничения. Проблема возникает из-за конкуренции системных промптов с историей диалога за внимание в контекстном окне.

Claude Code v2.1.121: MCP alwaysLoad, очистка плагинов, исправления прокрутки терминала и исправления утечек памяти
Claude Code v2.1.121 добавляет alwaysLoad для MCP-серверов, команду plugin prune, фильтр по вводу для /skills, замену вывода PostToolUse, исправления прокрутки терминала и URL, а также несколько исправлений утечек памяти, включая рост RSS на несколько ГБ при большом количестве изображений.

Приложение Claude возглавило чарты App Store в США, ассистенты на базе ИИ заняли первые 10 мест
Claude от Anthropic в настоящее время занимает первое место в чарте лучших приложений в американском App Store, ChatGPT находится на втором месте, а Google Gemini — на четвёртом. В первую десятку входят три ассистента с искусственным интеллектом наряду с приложениями для шопинга, социальных сетей и утилитами.

Скрытый финансовый пузырь в инфраструктуре ИИ – основные выводы
Критический анализ бума инвестиций в ИИ-инфраструктуру, предупреждающий о неустойчивом пузыре, похожем на прошлые технологические крахи. В PDF-документе утверждается, что колоссальные капитальные затраты на GPU и дата-центры значительно превышают фактическую генерацию доходов.