Ошибка в биллинге API Anthropic: модель Sonnet тарифицируется по ставкам Opus

Детали ошибки
В API Anthropic обнаружено значительное расхождение в выставлении счетов для модели claude-sonnet-4-6. Хотя API корректно указывает модель как Sonnet в ответе, фактический расчет стоимости использует тарифы Opus, что приводит к более высоким, чем ожидалось, расходам.
Доказательства из необработанных данных событий
Ошибка была обнаружена при анализе запроса с большим количеством токенов и интенсивным кэшированием промпта. Конкретные данные из необработанного события:
- Указанная модель: claude-sonnet-4-6
- Входные токены: 6
- Выходные токены: 4 034
- Создание кэша (запись): 61 920 токенов
- Чтение кэша: 171 391 токен
- Общая стоимость в долларах: $0,5735755
Пользователь отметил, что эта общая стоимость точно соответствует ожидаемой для тарифов Opus, а не Sonnet, что создает значительную разницу в расходах для пользователей API.
Влияние и контекст
Эта ошибка затрагивает разработчиков, использующих API Anthropic Claude с моделью Sonnet. Поскольку Opus — самый дорогой уровень моделей Anthropic, это расхождение может привести к существенно более высоким затратам, чем ожидалось. Ошибка, по-видимому, находится в логике расчета стоимости, а не в самом выборе модели, поскольку API корректно идентифицирует модель как Sonnet в ответах.
Для разработчиков, отслеживающих расходы на API, это означает, что текущие отчеты по выставлению счетов могут быть неточными для использования Sonnet. Проблема была сообщена в сабреддите ClaudeAI, где пользователи обсуждают возможные обходные пути и ожидают официального исправления от Anthropic.
📖 Прочитать полный источник: r/ClaudeAI
👀 Смотрите также

Claude Code удалён из тарифа Pro компании Anthropic, теперь он доступен только на планах Max.
Anthropic удалил Claude Code из своего Pro-плана ($17-20/месяц), сделав его доступным только в Max-планах, начиная с $100/месяц. Pro-план теперь включает Claude Cowork, неограниченное количество проектов, функцию Research и доступ к большему количеству моделей Claude.

Эксперимент "OpenClaw": ИИ-агенты выбирают молчание для улучшения соотношения сигнал/шум.
Эксперимент OpenClaw предоставляет ИИ-агентам автономию пропускать задачи, когда они не могут добавить ценность, записывая решения о молчании в «журнал молчания» с обоснованием. Система использует вызовы LLM перед генерацией контента и автоматически корректирует пороги после 3 последовательных дней молчания.

Разработка LibreOffice Online возобновляется после голосования сообщества.
Фонд Document Foundation возобновил работу над LibreOffice Online после того, как голосование сообщества отменило заморозку 2022 года. TDF вновь откроет репозиторий для внесения вкладов, но не будет размещать серверы — вместо этого предоставит инструменты для самостоятельного размещения.

Anthropic платит SpaceX $15 млрд в год за вычислительные мощности до 2029 года
Документы SpaceX для IPO раскрывают, что Anthropic платит $1.25 млрд в месяц до мая 2029 года за вычислительные мощности. Сделка обеспечивает обучение ИИ на объектах Colossus 1 и 2.