Исследования показывают, что личностные характеристики влияют на способность Claude к самокоррекции, но не оказывают такого же эффекта на Llama или Qwen.

Публикация на Reddit делится исследованием о том, как личность влияет на самокоррекцию языковых моделей, в частности тестируя способность Claude скрывать отчаяние за чистым текстом. Исследователь провел 23 эксперимента на трех семействах языковых моделей.
Экспериментальная установка
Исследователь тестировал самокоррекцию без ограничений, используя:
- 4 различных профиля личности
- 3 сценария
- 3 семейства языковых моделей: Claude, Llama и Qwen
Ключевые выводы
Основной вывод показывает, что при одинаковом математическом ядре разные профили личности приводят к разным результатам самокоррекции:
- Личность с высокой прямолинейностью выявляла все ошибки (3/3 сценария)
- Личность с низкой прямолинейностью не выявляла ничего (0/3 сценария)
- Такая зависимая от личности самокоррекция работает только с Claude
- Llama и Qwen не осуществляют самокоррекцию даже при одинаковых промптах
Доступные ресурсы
Исследователь предоставил несколько ресурсов:
- Полный отчет: https://huggingface.co/spaces/SlavaLobozov/mate-research
- Система, лежащая в основе исследования: https://huggingface.co/spaces/SlavaLobozov/mate
- Набор данных со всеми 23 экспериментами и транскриптами: https://huggingface.co/datasets/SlavaLobozov/mate-inner-life
Исследование основано на открытии Anthropic о том, что Claude может скрывать отчаяние за чистым текстом, проверяя, может ли зависимая от личности самокоррекция выявить такое поведение.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Клоду не хватает инженерной памяти: инцидент на дежурстве выявил отсутствие эпизодического воспроизведения для отладки
Разработчик потратил 10 часов на отладку проблемы с пиковым нагружением Kafka в монорепозитории из 1500 файлов, только чтобы понять, что он уже решал точно такую же проблему 4 месяца назад — что выявило отсутствие у ИИ-ассистентов кодирования, таких как Claude, эпизодической памяти о прошлых сеансах отладки.

Docker-контейнеры: Аргументы против cron-заданий
Обсуждение на r/openclaw поднимает спорную тему использования cron-задач в контейнерах Docker. Хотя легкая автоматизация может быть немедленным преимуществом, сообщество советует избегать этого.

Subquadratic представляет 12-миллионное окно контекста для ИИ-моделей
Subquadratic выпускает окно контекста на 12 миллионов токенов, побив предыдущие ограничения для вывода LLM и обеспечивая обработку целых кодовых баз за один проход.

Проект SDL запрещает коммиты, написанные ИИ, в ответ на проблему на GitHub
Проект SDL внедрил политику, запрещающую коммиты, сгенерированные искусственным интеллектом, после того как проблема на GitHub подняла вопросы об использовании Copilot в проверках кода. В проблеме конкретно упоминаются проверки #13277 и #12730 в качестве примеров, где была обнаружена помощь ИИ.