Диагностика регрессии производительности Claude Code: Конфигурация, а не интеллект модели

Anthropic опубликовала отчет о недавнем снижении производительности Claude Code. Результаты противоречат первоначальным предположениям сообщества: ухудшение произошло не из-за того, что модель "поумнела" или "отупела". Причиной стали три изменения в конфигурации продукта.
Три конкретных изменения, вызвавших регрессию
- Снижение усилий при рассуждении по умолчанию: В тестовой среде уменьшили стандартный уровень усилий для рассуждений, что привело к более поверхностному анализу.
- Ошибка кэширования сессий: Баг приводил к очистке предыдущих мыслительных процессов из кэша, нарушая последовательность между запросами.
- Изменение многословности промптов: Модификация промпта сократила объем ответов, что снизило качество генерируемого кода.
Anthropic откатила эти изменения в последнем обновлении, и производительность вернулась к прежнему уровню — та же модель, другая конфигурация, другое поведение.
Значение для команд, использующих ИИ-агентов кодирования
Практический вывод касается единицы доверия. Если вы доверяете модели, вы меняете модель при изменении поведения. Если вы доверяете экземпляру, вы ищете доказательства того, что конфигурация изменилась. Эти два подхода требуют совершенно разных инструментов — большинство команд не имеют доступа к журналам сессий и полагаются на интуицию в оценке работы агента.
Отчет полезен не тем, что разрешает споры, а тем, что показывает, как выглядит уровень доказательств, когда он действительно есть. Для команд, использующих Claude Code, отслеживание изменений конфигурации сессий и состояния кэша теперь является практической необходимостью.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Использование API артефактов Claude учитывается в квоте чата, а не в биллинге API.
Использование артефактов Claude внутри Claude приводит к обычным API-вызовам, которые перехватываются Anthropic и аутентифицируются через активную сессию, засчитываясь в квоту чата плана, а не в API-биллинг. Пользователи могут проверить это, протестировав артефакты и убедившись, что использование API в Claude Console остаётся нулевым.

Повышенное количество ошибок в Claude Opus 4.7: статус обновления и чего ожидать
По состоянию на 2026-05-19T15:21Z в Claude Opus 4.7 наблюдается повышенное количество ошибок. Следите за статусом на status.claude.com.

Qwen 3 8B превосходит более крупные модели в слепых экспертных оценках сложных задач.
В слепом парном оценивании 10 небольших языковых моделей на 13 сложных задачах передового уровня, Qwen 3 8B победил в 6 оценках и вошёл в тройку лучших в 12 из 13 задач, превзойдя модели с количеством параметров до 4 раз больше. Оценка охватывала отладку распределённых блокировок, конкурентные ошибки Go, оптимизацию SQL, байесовскую медицинскую диагностику, парадокс Симпсона, теорему голосования Эрроу и анализ ошибки выжившего.

Клод Код внезапно становится осторожным, запрашивая разрешение на рутинные задачи
Пользователь сообщает, что Claude Code периодически переключается с автономного выполнения на запрос чрезмерных разрешений даже для ежедневных, неизменных рабочих процессов, таких как пересборка монорепозитория и запуск тестов.