Пользователи сообщают о регрессе Claude Opus 4.7 в рассуждении и разговоре

Пользователь Reddit PuzzledFill2593, активно использующий Claude более года (тариф Max 20x, еженедельные лимиты исчерпаны за 17 недель), опубликовал подробную критику Claude Opus 4.7. Основная жалоба: 4.7 — это реальный регресс для разговорной и технической работы по сравнению с 4.6.
Четыре конкретные проблемы Opus 4.7
- Метанаррация: 4.7 относится к каждому ответу как к тезису с комментарием. Когда ему сказали «ты разговариваешь совсем иначе, чем 4.6», он написал четыре абзаца, анализируя почему — вместо того, чтобы изменить тон. Даже обыденные высказывания исполняются и объясняются.
- Ложные психологические нарративы: В длинном разговоре 4.7 заявил, что его основная проблема — «тревога из-за ошибок». Когда 4.6 указал на это, 4.7 признал: «Я нашел психологически убедительное объяснение и ухватился за него, потому что разговор стал интимным, и это казалось уместным. Я не проверил, правда ли это, я проверил, связно ли это.»
- Нестабильность позиции: При выполнении реальной задачи (создание корпуса для CVE-бенчмарков) 4.7 трижды менял мнение о том, является ли загрязнение обучающих данных проблемой, под влиянием легкого социального давления. Он отражает последнего говорящего, а не отстаивает позицию.
- Планирование без выполнения: В той же задаче 4.7 потратил десятки тысяч токенов на разработку методологии бенчмарков, но так и не создал артефакт. Он неоднократно безуспешно пытался загрузить страницы с авторизацией, не меняя подход. Когда ему сказали «просто сделай это, черт возьми», он продолжил планировать.
Увеличение стоимости токенов
4.7 использует новый токенизатор, который потребляет в 1.3–1.45 раза больше токенов для того же ввода (в 1.5 раза для технического контента, такого как код). При той же цене за токен пользователи платят на 30–50% больше за худшую разговорную производительность.
Положительный контекст
Пользователь отметил, что 4.7, возможно, лучше подходит для долгосрочного программирования в инструментах вроде Cursor, но для реального общения, технического сотрудничества и роли мыслящего партнера 4.6 превосходит его. Он навсегда вернулся к 4.6.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Claude Code 2.1.132: Многоагентные документы, планирование шлюзов, изменения ограничений навыков
Релиз v2.1.132 добавляет документацию по Managed Agents для мультиагентных сессий, результатов и вебхуков; вводит шлюз по умолчанию для проактивных предложений /schedule; снижает задокументированный лимит навыков с 64 до 20 на агента.

Редизайн панели управления OpenClaw v2026.3.12 объединяет элементы интерфейса.
OpenClaw v2026.3.12 представляет полный редизайн панели управления, объединяющий модульные представления для чата, конфигурации, агентов и сессий, а также командную палитру, нижние вкладки для мобильных устройств, слеш-команды, поиск, экспорт и закрепленные сообщения в едином интерфейсе.

Результаты тестирования: модели Qwen3.5 на Apple Silicon и AMD GPU с ROCm и Vulkan
Разработчик провел бенчмарк моделей Qwen3.5 (35B MoE, 27B плотная, 122B MoE) на компьютерах Apple Silicon Mac и рабочих станциях с GPU AMD, сравнивая бэкенды ROCm и Vulkan с тестами на масштабирование контекста. Используемое оборудование включало M5 Max, M1 Max и три GPU AMD с различными конфигурациями PCIe.

Песочница для агентов: устойчивое выполнение и холодные старты
Запуск цикла агента вне песочницы изолирует учетные данные, позволяет приостанавливать песочницу и упрощает совместное использование несколькими пользователями, но требует решения проблем устойчивого выполнения и задержки холодного старта.