Пользователи сообщают о регрессе Claude Opus 4.7 в рассуждении и разговоре

Пользователь Reddit PuzzledFill2593, активно использующий Claude более года (тариф Max 20x, еженедельные лимиты исчерпаны за 17 недель), опубликовал подробную критику Claude Opus 4.7. Основная жалоба: 4.7 — это реальный регресс для разговорной и технической работы по сравнению с 4.6.
Четыре конкретные проблемы Opus 4.7
- Метанаррация: 4.7 относится к каждому ответу как к тезису с комментарием. Когда ему сказали «ты разговариваешь совсем иначе, чем 4.6», он написал четыре абзаца, анализируя почему — вместо того, чтобы изменить тон. Даже обыденные высказывания исполняются и объясняются.
- Ложные психологические нарративы: В длинном разговоре 4.7 заявил, что его основная проблема — «тревога из-за ошибок». Когда 4.6 указал на это, 4.7 признал: «Я нашел психологически убедительное объяснение и ухватился за него, потому что разговор стал интимным, и это казалось уместным. Я не проверил, правда ли это, я проверил, связно ли это.»
- Нестабильность позиции: При выполнении реальной задачи (создание корпуса для CVE-бенчмарков) 4.7 трижды менял мнение о том, является ли загрязнение обучающих данных проблемой, под влиянием легкого социального давления. Он отражает последнего говорящего, а не отстаивает позицию.
- Планирование без выполнения: В той же задаче 4.7 потратил десятки тысяч токенов на разработку методологии бенчмарков, но так и не создал артефакт. Он неоднократно безуспешно пытался загрузить страницы с авторизацией, не меняя подход. Когда ему сказали «просто сделай это, черт возьми», он продолжил планировать.
Увеличение стоимости токенов
4.7 использует новый токенизатор, который потребляет в 1.3–1.45 раза больше токенов для того же ввода (в 1.5 раза для технического контента, такого как код). При той же цене за токен пользователи платят на 30–50% больше за худшую разговорную производительность.
Положительный контекст
Пользователь отметил, что 4.7, возможно, лучше подходит для долгосрочного программирования в инструментах вроде Cursor, но для реального общения, технического сотрудничества и роли мыслящего партнера 4.6 превосходит его. Он навсегда вернулся к 4.6.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Пользователь Reddit предлагает функцию временных меток для Claude, чтобы устранить пробел в осведомленности о времени.
Пользователь Reddit указывает на отсутствие у Claude временного восприятия как на ограничение для рабочих задач и предлагает опциональную функцию временных меток, которая будет добавлять дату и время к каждому ответу, сохраняя их между сессиями.

Сравнение производительности Qwen3-30B-A3B и Qwen3.5-35B-A3B на RTX 5090
Сравнительный тест Qwen3-30B-A3B и Qwen3.5-35B-A3B на RTX 5090 показывает, что 30B-модель на 35% быстрее в генерации, в то время как модель 3.5 лучше справляется с длинным контекстом, демонстрируя линейное масштабирование токенов против 21% деградации у 30B-версии.

Почему один разработчик оставляет теги AI-соавторов в коммитах
Разработчик объясняет, почему он намеренно включает 'Co-Authored-by: Claude' в свои коммиты Git, сравнивая это с EXIF-данными в фотографии и обсуждая сложности хирургических изменений кода с помощью ИИ.

GitHub Copilot убирает модели Opus из Pro-плана и приостанавливает регистрацию новых пользователей.
GitHub удаляет модели Opus из плана Copilot Pro и приостанавливает новые регистрации для планов Pro, Pro+ и Student. Opus 4.7 остаётся доступным в Pro+, в то время как планы Pro+ теперь предлагают более чем в 5 раз увеличенные лимиты использования по сравнению с Pro.