Opus 4.6 Средний против Низкого: Различия в производительности и ценообразовании

Анализ конфигураций модели Opus 4.6 выявляет значительные различия между версиями low и medium как в производительности, так и в стоимости.
Ключевые выводы из анализа Reddit
Исходный материал подчеркивает несколько конкретных проблем с Opus 4.6 (low):
- Opus 4.6 (low) демонстрирует "подлинно ленивое" поведение, которое может быть проблематичным, когда процесс важнее конечных результатов
- В одном задокументированном случае, когда модель попросили исследовать исторические данные об атаках США на Иран, маломощный агент решил полагаться на внутренние знания вместо выполнения поиска в Google, из-за чего пропустил недавние события
- Версия medium не имеет этой проблемы с ленью
Сравнение производительности и цены
- Opus 4.6 (medium) стоит примерно на 50% дороже, чем Opus 4.6 (low)
- По производительности версия medium занимает почти точно промежуточное положение между 4.6 low и 4.6 high
- Полный отчет о 26 конфигурациях моделей, протестированных на границах Парето по вычислительным ресурсам, доступен на everyrow.io
Для разработчиков, использующих ИИ-агентов для программирования, эта информация актуальна при выборе между конфигурациями моделей на основе бюджетных ограничений и требований к производительности.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Изменения биллинга Claude Agent SDK с 15 июня: кредиты на пользователя, без переноса, жесткий дедлайн
Начиная с 15 июня использование Claude Agent SDK и claude -p перестает учитываться в рамках лимитов подписки Claude. Каждый пользователь получает отдельный ежемесячный кредит (например, Pro $20, Max 5x $100). Кредиты не объединяются, не переносятся и имеют жесткое ограничение.

Anthropic добавляет функцию импорта памяти для перехода с ChatGPT/Gemini на Claude
Новая функция импорта памяти от Anthropic позволяет пользователям переносить предпочтения, проекты, контекст и рабочий стиль из ChatGPT, Gemini или других ИИ в Claude всего за пару шагов копирования-вставки, устраняя необходимость начинать обучение с нуля.

Claude Code v2.1.161: Атрибуты OTEL, исправления параллельных инструментов и редактирование секретов MCP
v2.1.161 включает атрибуты ресурсов OTEL в качестве метрик, независимые результаты параллельных вызовов инструментов, редактирование секретов MCP и множество исправлений ошибок для субагентов, хуков Windows и событий журнала OpenTelemetry.

Claude Managed Agents добавляет возможность мечтать, результаты, мультиагентную оркестрацию и вебхуки
Мечтание — это запланированный процесс курирования памяти, который в тестах Harvey улучшил показатель выполнения задач примерно в 6 раз. Результаты, многопользовательская оркестрация и вебхуки теперь доступны в открытой бета-версии на платформе Claude.