Опус 4.6: Расширенное мышление демонстрирует худшие результаты в задачах с физическими диаграммами.

✍️ OpenClawRadar📅 Опубликовано: 17 апреля 2026 г.🔗 Source
Опус 4.6: Расширенное мышление демонстрирует худшие результаты в задачах с физическими диаграммами.
Ad

Проблема производительности в режиме расширенного мышления

Пользователь на r/ClaudeAI сообщил о тестировании Opus 4.6 и Gemini 3.1 Pro на физических задачах, требующих интерпретации визуальных диаграмм. Тестирование выявило конкретную регрессию производительности в Opus 4.6 при использовании режима расширенного мышления.

Ключевые выводы тестирования

  • Объём тестирования: 5 физических задач, где «значительная часть задачи заключается в интерпретации визуальных диаграмм, отображающих сценарии»
  • Opus 4.6 с расширенным мышлением: Допустил ошибки во всех 5 задачах «из-за фундаментального неверного толкования диаграммы»
  • Gemini 3.1 Pro: «Блестяще справился» со всеми 5 задачами
  • Opus 4.6 без расширенного мышления: Успешно решил задачи и был «гораздо быстрее»

Пользователь описал это как «поистине странное поведение», поскольку расширенное мышление обычно улучшает производительность, но в этом конкретном случае интерпретации диаграмм оно вызвало последовательные неудачи.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

🦀
Новости

Мнение UX-дизайнера: Дизайн Claude не может заменить опытных дизайнеров

UX-дизайнер утверждает, что Claude Design переоценен и полезен только для не-дизайнеров, чтобы прототипировать идеи, начинающих стартапов и портфолио для новичков.

OpenClawRadar
План Claude Max 20x: лимиты не увеличены, несмотря на объявления — пользователь подтверждает математически
Новости

План Claude Max 20x: лимиты не увеличены, несмотря на объявления — пользователь подтверждает математически

Пользователь, платящий $200/месяц за Claude Max 20x, сообщает, что объявленные Anthropic увеличения лимитов (2x на сессию и 1.5x на неделю) не были применены к его аккаунту. Он приводит математическое доказательство и рассказывает о полном отсутствии ответа от поддержки.

OpenClawRadar
Ричард Докинз считает, что ИИ обладает сознанием — эксперты возражают
Новости

Ричард Докинз считает, что ИИ обладает сознанием — эксперты возражают

Эволюционный биолог Ричард Докинз после продолжительных бесед с Claude от Anthropic и ChatGPT от OpenAI пришел к выводу, что ИИ обладают сознанием. Большинство когнитивных ученых решительно не согласны, называя это антропоморфизмом.

OpenClawRadar
Курс CS25 по трансформаторам Стэнфордского университета открыт для публики с прямой трансляцией
Новости

Курс CS25 по трансформаторам Стэнфордского университета открыт для публики с прямой трансляцией

Семинар Стэнфордского университета CS 25 по трансформерам теперь открыт для публики. Лекции начнутся 23 января 2025 года с 16:30 до 17:50 по тихоокеанскому времени (PDT). Их можно посещать лично в аудитории Skilling Auditorium или через Zoom, а записи будут публиковаться онлайн.

OpenClawRadar