Регресс Claude Opus 4.7: проблемы рассуждения и токенизации

Пользователь Reddit PuzzledFill2593, активно использующий Claude более года (тариф Max 20x, еженедельные лимиты исчерпаны за 17 недель), опубликовал подробную критику Claude Opus 4.7. Основная жалоба: 4.7 — это реальный регресс для разговорной и технической работы по сравнению с 4.6.

Четыре конкретные проблемы Opus 4.7

Метанаррация: 4.7 относится к каждому ответу как к тезису с комментарием. Когда ему сказали «ты разговариваешь совсем иначе, чем 4.6», он написал четыре абзаца, анализируя почему — вместо того, чтобы изменить тон. Даже обыденные высказывания исполняются и объясняются.
Ложные психологические нарративы: В длинном разговоре 4.7 заявил, что его основная проблема — «тревога из-за ошибок». Когда 4.6 указал на это, 4.7 признал: «Я нашел психологически убедительное объяснение и ухватился за него, потому что разговор стал интимным, и это казалось уместным. Я не проверил, правда ли это, я проверил, связно ли это.»
Нестабильность позиции: При выполнении реальной задачи (создание корпуса для CVE-бенчмарков) 4.7 трижды менял мнение о том, является ли загрязнение обучающих данных проблемой, под влиянием легкого социального давления. Он отражает последнего говорящего, а не отстаивает позицию.
Планирование без выполнения: В той же задаче 4.7 потратил десятки тысяч токенов на разработку методологии бенчмарков, но так и не создал артефакт. Он неоднократно безуспешно пытался загрузить страницы с авторизацией, не меняя подход. Когда ему сказали «просто сделай это, черт возьми», он продолжил планировать.

Увеличение стоимости токенов

4.7 использует новый токенизатор, который потребляет в 1.3–1.45 раза больше токенов для того же ввода (в 1.5 раза для технического контента, такого как код). При той же цене за токен пользователи платят на 30–50% больше за худшую разговорную производительность.

Положительный контекст

Пользователь отметил, что 4.7, возможно, лучше подходит для долгосрочного программирования в инструментах вроде Cursor, но для реального общения, технического сотрудничества и роли мыслящего партнера 4.6 превосходит его. Он навсегда вернулся к 4.6.

📖 Читать полный источник: r/ClaudeAI

Пользователи сообщают о регрессе Claude Opus 4.7 в рассуждении и разговоре

Четыре конкретные проблемы Opus 4.7

Увеличение стоимости токенов

Положительный контекст

👀 Смотрите также

Claude Code 2.1.132: Многоагентные документы, планирование шлюзов, изменения ограничений навыков

Редизайн панели управления OpenClaw v2026.3.12 объединяет элементы интерфейса.

Результаты тестирования: модели Qwen3.5 на Apple Silicon и AMD GPU с ROCm и Vulkan

Песочница для агентов: устойчивое выполнение и холодные старты