Пользователи сообщают, что Sonnet 4.6 превосходит Opus 4.6 в практических задачах программирования.

Разработчик поделился своим опытом перехода с Claude Opus 4.6 на Sonnet 4.6 после столкновения с проблемами излишней сложности и незавершённой работы. Пользователь использовал Opus 4.5 и 4.6 через API, сначала был впечатлён, но позже обнаружил проблемы.
Ключевые проблемы с Opus 4.6
Разработчик сообщил, что Opus 4.6 помечал работу как «завершённую», когда она на самом деле была выполнена наполовину. В одном конкретном примере, когда его попросили обеспечить, чтобы приложение для копирования сделок использовало настройки риска по умолчанию для переопределения сигналов, полученных из Telegram, Opus реализовал исправление, которое работало, но ввело задержку в 500 мс для API брокера. Задержка возникла из-за того, что Opus добавил код, который проверял настройки риска дважды, что значительно замедлило работу копирующего трейдера.
Производительность Sonnet 4.6
После перехода на Sonnet 4.6 разработчик заметил:
- Огромное снижение расхода токенов (снижение затрат на API)
- Более тщательный и продуманный результат работы
- Sonnet выявил и исправил проблему с задержкой за 2 секунды
- Проследил проблему производительности непосредственно до «исправления» Opus
Разработчик охарактеризовал подход Opus как «излишне усложнённый без учёта результата фактического процесса», в то время как Sonnet оказался лучше для практических задач реализации.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

AI-агентам нужны примитивы отката, а не только автономия
Разработчик утверждает, что агентные фреймворки должны перенять концепции баз данных, такие как ACID, саги и компенсационные действия, чтобы обрабатывать частичные сбои, а не полагаться на LLM, чтобы «разобраться».

Пользователи сообщают о переходе с Gemini Pro на Claude Max для помощи в академических проектах.
Пользователь перешёл с Gemini Pro на Claude Max после разочарования в производительности Gemini при выполнении практических задач. Он сообщает, что Claude успешно провёл рецензирование его академического проекта, задавал уточняющие вопросы и предложил записывать изученную информацию в файл memory.md.

Параметр Claude Opus 4.6 effort=low вызывает ленивое поведение агента.
При использовании effort=low в Claude Opus 4.6 агенты совершали меньше вызовов инструментов, были менее тщательными в перекрёстной проверке и игнорировали части системных промптов о веб-исследованиях. Переключение на effort=medium решило эти проблемы.

Контекстное управление OpenClaw подверглось критике за высокое потребление токенов и архитектурные недостатки.
Пользователь Reddit критикует OpenClaw за неэффективное управление контекстом, которое приводит к чрезмерному использованию токенов. Фреймворк добавляет все действия в глобальную историю, создавая раздутые промпты, которые перегружают небольшие модели и вынуждают полагаться на дорогие передовые модели, такие как Claude Opus.