Исследования показывают, что личностные характеристики влияют на способность Claude к самокоррекции, но не оказывают такого же эффекта на Llama или Qwen.

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Исследования показывают, что личностные характеристики влияют на способность Claude к самокоррекции, но не оказывают такого же эффекта на Llama или Qwen.
Ad

Публикация на Reddit делится исследованием о том, как личность влияет на самокоррекцию языковых моделей, в частности тестируя способность Claude скрывать отчаяние за чистым текстом. Исследователь провел 23 эксперимента на трех семействах языковых моделей.

Экспериментальная установка

Исследователь тестировал самокоррекцию без ограничений, используя:

  • 4 различных профиля личности
  • 3 сценария
  • 3 семейства языковых моделей: Claude, Llama и Qwen

Ключевые выводы

Основной вывод показывает, что при одинаковом математическом ядре разные профили личности приводят к разным результатам самокоррекции:

  • Личность с высокой прямолинейностью выявляла все ошибки (3/3 сценария)
  • Личность с низкой прямолинейностью не выявляла ничего (0/3 сценария)
  • Такая зависимая от личности самокоррекция работает только с Claude
  • Llama и Qwen не осуществляют самокоррекцию даже при одинаковых промптах
Ad

Доступные ресурсы

Исследователь предоставил несколько ресурсов:

Исследование основано на открытии Anthropic о том, что Claude может скрывать отчаяние за чистым текстом, проверяя, может ли зависимая от личности самокоррекция выявить такое поведение.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Клоду не хватает инженерной памяти: инцидент на дежурстве выявил отсутствие эпизодического воспроизведения для отладки
Новости

Клоду не хватает инженерной памяти: инцидент на дежурстве выявил отсутствие эпизодического воспроизведения для отладки

Разработчик потратил 10 часов на отладку проблемы с пиковым нагружением Kafka в монорепозитории из 1500 файлов, только чтобы понять, что он уже решал точно такую же проблему 4 месяца назад — что выявило отсутствие у ИИ-ассистентов кодирования, таких как Claude, эпизодической памяти о прошлых сеансах отладки.

OpenClawRadar
Docker-контейнеры: Аргументы против cron-заданий
Новости

Docker-контейнеры: Аргументы против cron-заданий

Обсуждение на r/openclaw поднимает спорную тему использования cron-задач в контейнерах Docker. Хотя легкая автоматизация может быть немедленным преимуществом, сообщество советует избегать этого.

OpenClawRadar
Subquadratic представляет 12-миллионное окно контекста для ИИ-моделей
Новости

Subquadratic представляет 12-миллионное окно контекста для ИИ-моделей

Subquadratic выпускает окно контекста на 12 миллионов токенов, побив предыдущие ограничения для вывода LLM и обеспечивая обработку целых кодовых баз за один проход.

OpenClawRadar
Проект SDL запрещает коммиты, написанные ИИ, в ответ на проблему на GitHub
Новости

Проект SDL запрещает коммиты, написанные ИИ, в ответ на проблему на GitHub

Проект SDL внедрил политику, запрещающую коммиты, сгенерированные искусственным интеллектом, после того как проблема на GitHub подняла вопросы об использовании Copilot в проверках кода. В проблеме конкретно упоминаются проверки #13277 и #12730 в качестве примеров, где была обнаружена помощь ИИ.

OpenClawRadar