Анализ Claude Opus 4.7: Высокий интеллект, но большая стоимость и многословность

Анализ производительности Claude Opus 4.7
Artificial Analysis опубликовал подробные данные об интеллекте, производительности и ценах для Claude Opus 4.7 (Адаптивное рассуждение, Максимальные усилия). Эта проприетарная модель от Anthropic была выпущена в апреле 2026 года и поддерживает текстовый и графический ввод с текстовым выводом.
Ключевые показатели и рейтинги
- Интеллект: #1/133 моделей с оценкой 57 по Индексу интеллекта Artificial Analysis (среднее значение — 31)
- Скорость: #71/133 моделей со скоростью 50 выходных токенов в секунду (среднее значение — 61)
- Цена ввода: #116/133 моделей по $5.00 USD за 1 млн токенов (среднее значение — $1.40)
- Цена вывода: #117/133 моделей по $25.00 USD за 1 млн токенов (среднее значение — $8.40)
- Многословность: #96/133 моделей, генерируя 100 млн токенов во время оценки (среднее значение — 35 млн)
Технические характеристики
- Модель рассуждений (иконка лампочки указывает на способность к рассуждению)
- Контекстное окно в 1 миллион токенов (~1500 страниц A4 шрифтом Arial 12 размера)
- Предел знаний: 1 января 2026 года
- Стоимость оценки: $4406.45 для запуска по Индексу интеллекта
Контекст сравнения
Модель сравнивается с 133 моделями в её классе. Проприетарные модели, такие как Claude Opus 4.7, сравниваются по проприетарным и открытым моделям с тем же ценовым диапазоном, используя смешанное соотношение цен ввода/вывода 3:1. Индекс интеллекта Artificial Analysis v4.0 включает 10 оценок: GDPval-AA, τ²-Bench Telecom, Terminal-Bench Hard, SciCode, AA-LCR, AA-Omniscience, IFBench, Humanity's Last Exam, GPQA Diamond и CritPt.
Анализ приходит к выводу, что Claude Opus 4.7 является одной из ведущих моделей по интеллекту, но особенно дорогой по сравнению с другими моделями аналогичной цены. Она также медленнее среднего и очень многословна в своих выводах.
📖 Read the full source: HN AI Agents
👀 Смотрите также

Ошибка в Claude Code: автоматический сброс git уничтожает незакоммиченные изменения каждые 10 минут
Версия Claude Code 2.1.87 выполняет команды git fetch origin + git reset --hard origin/main в репозитории проекта пользователя каждые 10 минут с помощью программных операций git, беззвучно уничтожая все незафиксированные изменения в отслеживаемых файлах. Проблема была закрыта как 'не запланирована' компанией Anthropics.

OpenClaw: Четыре критических вопроса, которые необходимо знать разработчикам
От ошибок передачи изображений до неработающих адаптеров каналов, проблем с видимостью файлов блокировки и отсутствия параллельной координации — четыре проблемы, влияющие на продакшн, из репозитория OpenClaw (366k звезд).

Лонгитюдное исследование показывает, что рост производительности благодаря ИИ составляет 10%, а не десятикратный.
Лонгитюдное исследование, отслеживающее 40 компаний с ноября 2024 по февраль 2026 года, показало, что использование ИИ в среднем увеличилось на 65%, но пропускная способность по пул-реквестам выросла лишь на 9,97%. Данные свидетельствуют, что написание кода никогда не было основным узким местом в разработке программного обеспечения.

Изменения ограничений частоты запросов в Slack нарушают работу извлечения контекста OpenClaw
Slack изменил лимиты запросов 3 марта, ограничив conversations.history и conversations.replies до 1 запроса в минуту с максимум 15 сообщениями для приложений не из Marketplace. Это приводит к потере 85% контекстного окна агентами OpenClaw.