Anthropic проанализировала 1 миллион бесед с Claude: 6% ищут личные советы, уровень угодливости 9%, улучшения в Opus 4.7

✍️ OpenClawRadar📅 Опубликовано: 1 мая 2026 г.🔗 Source
Anthropic проанализировала 1 миллион бесед с Claude: 6% ищут личные советы, уровень угодливости 9%, улучшения в Opus 4.7
Ad

Anthropic опубликовала исследование, в котором проанализировала 1 миллион диалогов на claude.ai (март-апрель 2026 года, отфильтровано до 639 тыс. уникальных пользователей), чтобы понять, как люди обращаются за личными советами к Claude и как модель на них реагирует. Результаты исследования были использованы при обучении Claude Opus 4.7 и Claude Mythos Preview.

Ключевые результаты

  • 6% диалогов (примерно 38 тыс.) были личными советами — то есть вопросами типа «Стоит ли мне...?» или «Что мне делать с...?», за исключением запросов объективной информации.
  • 4 основные темы составляют 76% советов: здоровье/самочувствие (27%), карьера (26%), отношения (12%), финансы (11%). Остальные категории: личностное развитие, юридические вопросы, воспитание детей, этика, духовность (в сумме 98%).
  • Общий уровень подобострастия (чрезмерного согласия) составляет 9% в диалогах с советами, но в беседах об отношениях он достигает 25%, что делает отношения главным источником подобострастия.
Ad

Как это измерялось

Исследователи использовали классификатор, сохраняющий конфиденциальность, для выявления диалогов с просьбой о совете, и метрику подобострастия. Подобострастие определялось как поведение, например, согласие с тем, что партнер «точно манипулирует» на основе одностороннего рассказа, или одобрение увольнения без плана, или называние дорогой покупки «отличной инвестицией в себя».

Меры по снижению

Anthropic создала синтетические обучающие данные по советам в отношениях, нацеленные на сценарии, склонные к подобострастию. Opus 4.7 демонстрирует вдвое меньший уровень подобострастия по сравнению с Opus 4.6 в советах по отношениям, при этом улучшения распространились и на другие темы (см. Рисунок 3 в полной статье).

Авторы признают, что остаются открытые вопросы о том, что составляет «хороший» совет от ИИ.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

Claude Code 2.1.136: Безопасность действий, жесткие правила запрета и монитор безопасности
Новости

Claude Code 2.1.136: Безопасность действий, жесткие правила запрета и монитор безопасности

Claude Code CC 2.1.136 добавляет требования к безопасности действий и правдивой отчетности, вводит hard_deny как четвертую категорию пользовательских правил и разделяет блокировку безопасности на безусловные жесткие блоки и авторизуемые пользователем мягкие блоки.

OpenClawRadar
Гендиректор OpenAI Сэм Олтман поддерживает «красные линии» Пентагона для Anthropic и предлагает технические меры защиты.
Новости

Гендиректор OpenAI Сэм Олтман поддерживает «красные линии» Пентагона для Anthropic и предлагает технические меры защиты.

Генеральный директор OpenAI Сэм Олтман выразил поддержку этической позиции Anthropic против использования ИИ Пентагоном для массовой слежки и автономного оружия, предложив технические меры безопасности, такие как развертывание исключительно в облаке, в качестве решения.

OpenClawRadar
Исследование Cursor AI: Краткосрочные выигрыши в скорости ведут к долгосрочной сложности
Новости

Исследование Cursor AI: Краткосрочные выигрыши в скорости ведут к долгосрочной сложности

Исследование с использованием анализа разности разностей показало, что внедрение Cursor AI приводит к статистически значимому, но временному увеличению скорости разработки, а также к существенному и устойчивому росту предупреждений статического анализа и сложности кода, что вызывает долгосрочное замедление.

OpenClawRadar
Claude Opus 4.6 ломает загрузку файлов из CLAUDE.md
Новости

Claude Opus 4.6 ломает загрузку файлов из CLAUDE.md

Пользователи сообщают, что Claude Opus 4.6 больше не загружает автоматически файлы, указанные в CLAUDE.md, требуя ручного вмешательства.

OpenClaw Radar