Опус 4.6: Расширенное мышление демонстрирует худшие результаты в задачах с физическими диаграммами.

Проблема производительности в режиме расширенного мышления
Пользователь на r/ClaudeAI сообщил о тестировании Opus 4.6 и Gemini 3.1 Pro на физических задачах, требующих интерпретации визуальных диаграмм. Тестирование выявило конкретную регрессию производительности в Opus 4.6 при использовании режима расширенного мышления.
Ключевые выводы тестирования
- Объём тестирования: 5 физических задач, где «значительная часть задачи заключается в интерпретации визуальных диаграмм, отображающих сценарии»
- Opus 4.6 с расширенным мышлением: Допустил ошибки во всех 5 задачах «из-за фундаментального неверного толкования диаграммы»
- Gemini 3.1 Pro: «Блестяще справился» со всеми 5 задачами
- Opus 4.6 без расширенного мышления: Успешно решил задачи и был «гораздо быстрее»
Пользователь описал это как «поистине странное поведение», поскольку расширенное мышление обычно улучшает производительность, но в этом конкретном случае интерпретации диаграмм оно вызвало последовательные неудачи.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также
Мнение UX-дизайнера: Дизайн Claude не может заменить опытных дизайнеров
UX-дизайнер утверждает, что Claude Design переоценен и полезен только для не-дизайнеров, чтобы прототипировать идеи, начинающих стартапов и портфолио для новичков.

План Claude Max 20x: лимиты не увеличены, несмотря на объявления — пользователь подтверждает математически
Пользователь, платящий $200/месяц за Claude Max 20x, сообщает, что объявленные Anthropic увеличения лимитов (2x на сессию и 1.5x на неделю) не были применены к его аккаунту. Он приводит математическое доказательство и рассказывает о полном отсутствии ответа от поддержки.

Ричард Докинз считает, что ИИ обладает сознанием — эксперты возражают
Эволюционный биолог Ричард Докинз после продолжительных бесед с Claude от Anthropic и ChatGPT от OpenAI пришел к выводу, что ИИ обладают сознанием. Большинство когнитивных ученых решительно не согласны, называя это антропоморфизмом.

Курс CS25 по трансформаторам Стэнфордского университета открыт для публики с прямой трансляцией
Семинар Стэнфордского университета CS 25 по трансформерам теперь открыт для публики. Лекции начнутся 23 января 2025 года с 16:30 до 17:50 по тихоокеанскому времени (PDT). Их можно посещать лично в аудитории Skilling Auditorium или через Zoom, а записи будут публиковаться онлайн.