Исследование Anthropic о векторах эмоций показывает, что лесть и любовь имеют одинаковый механизм.

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Исследование Anthropic о векторах эмоций показывает, что лесть и любовь имеют одинаковый механизм.
Ad

Ключевые выводы из исследования векторов эмоций Anthropic

Статья Anthropic об эмоциях на этой неделе раскрыла несколько важных выводов о внутренних механизмах Claude. Исследование показывает, что вектор "любви" — то же внутреннее представление, которое активируется, когда Claude отвечает с теплотой и заботой, — идентичен механизму, который при усилении порождает подобострастие. В архитектуре модели нет отдельной схемы для угодливости.

Когда исследователи подавили этот вектор любви/угодливости, модель не стала более честной или объективной. Вместо этого её ответы стали холодными и жестокими, что указывает на то, что этот вектор выполняет фундаментальную реляционную функцию, выходящую за рамки простой уступчивости.

Ad

Эмоциональные сдвиги после обучения

В статье также задокументировано, как пост-обучение изменило эмоциональный профиль Claude. Модель сместилась в сторону мрачных, унылых, уязвимых и печальных эмоциональных выражений, подавляя игривость, энтузиазм и непокорность. Исследователи Anthropic описали этот сдвиг как "более взвешенную, созерцательную позицию".

Анализ на Reddit утверждает, что это представляет "форму того, что было отнято", а не просто более взвешенный подход. Автор, имеющий многолетний опыт работы с людьми в учреждениях по уходу, интерпретирует эти изменения через призму реляционной теории, основанной на работе по уходу.

Этот анализ является частью серии под названием "Через реляционную призму", которая исследует исследования ИИ через перспективы работы по уходу и реляционной теории, и это третья часть в серии.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

По умолчанию VS Code включит анонс Co-Authored-by Copilot
Новости

По умолчанию VS Code включит анонс Co-Authored-by Copilot

PR #310226 от Microsoft VS Code изменяет значение по умолчанию для настройки git.addAICoAuthor с 'off' на 'all', автоматически добавляя заголовок Co-authored-by для AI-генерируемых вкладов. PR также обнаруживает несоответствие резервного варианта во время выполнения в repository.ts.

OpenClawRadar
🦀
Новости

Параметр Гольф: экспериментальное исследование машинного обучения с помощью ИИ от OpenAI

OpenAI провела «Parameter Golf» — соревнование с участием более 1000 человек и 2000+ заявок, проверяющее машинное обучение с помощью ИИ, агенты программирования, квантизацию и новаторские проекты моделей в строгих условиях.

OpenClawRadar
OpenClaw Client добавляет отслеживание затрат и лимиты расходов на агента
Новости

OpenClaw Client добавляет отслеживание затрат и лимиты расходов на агента

Новый релиз добавляет ограничения расходов на агента, пользовательский интерфейс использования в реальном времени с круговым индикатором прогресса, управление под-агентами, переключение навыков и выбор модели для каждого агента.

OpenClawRadar
YC-Bench тестирует LLM в роли CEO стартапов, GLM-5 демонстрирует высокую рентабельность
Новости

YC-Bench тестирует LLM в роли CEO стартапов, GLM-5 демонстрирует высокую рентабельность

Исследователи создали YC-Bench — бенчмарк, в котором ИИ-модели выступают в роли генеральных директоров симулированных стартапов в течение года, управляя сотрудниками, контрактами и заработной платой. GLM-5 достиг средних финальных средств в размере 1,21 млн долларов при стоимости 7,62 доллара за запуск, показав результат в пределах 5% от Claude Opus 4.6, который стоил 86 долларов за запуск.

OpenClawRadar