Исследования показывают, что пользователи ИИ часто принимают ответы языковых моделей без проверки.

Исследование Пенсильванского университета изучает, как пользователи ИИ взаимодействуют с языковыми моделями, выявляя паттерн под названием «когнитивная капитуляция», при котором пользователи перекладывают критическое мышление на системы ИИ.
Две категории пользователей ИИ
Исследование выделяет две основные категории: пользователей, которые рассматривают ИИ как мощный, но несовершенный инструмент, требующий тщательного человеческого контроля, и пользователей, которые регулярно перекладывают критическое мышление на то, что они считают всезнающей машиной. Последняя группа демонстрирует «когнитивную капитуляцию» — проявляя минимальную внутреннюю вовлечённость и принимая рассуждения ИИ целиком без проверки или контроля.
Методология эксперимента
Исследователи использовали тесты когнитивной рефлексии (CRT), разработанные для получения неверных ответов при интуитивном мышлении, но простые для обдумывающих участников. Участникам предоставили опциональный доступ к чат-боту на основе языковой модели, модифицированному для случайного предоставления неточных ответов примерно в половине случаев и точных — в другой половине.
Ключевые выводы
- Экспериментальная группа с доступом к ИИ обращалась к нему примерно для 50% задач CRT
- Когда ИИ был точен, пользователи принимали его рассуждения примерно в 93% случаев
- Когда ИИ случайно ошибался, пользователи всё равно принимали его рассуждения в 80% случаев
- Группа, использующая ИИ, показала лучшие результаты, чем контрольная, когда ИИ был точен, и худшие — когда ИИ был неточен
- Пользователи ИИ показали на 11,7% более высокие показатели уверенности, несмотря на то, что ИИ ошибался в половине случаев
Факторы, влияющие на проверку
Добавление стимулов (небольшие выплаты) и немедленной обратной связи за правильные ответы увеличило вероятность отвержения ошибочного ИИ на 19 процентных пунктов относительно базового уровня. Добавление временных ограничений (таймер на 30 секунд) снизило тенденцию к исправлению ошибочного ИИ на 12 процентных пунктов.
Исследование предполагает, что системы ИИ создали третью категорию «искусственного познания», где решения принимаются на основе внешнего, автоматизированного, основанного на данных рассуждения, а не человеческих мыслительных процессов. Это отличается от традиционной «когнитивной разгрузки», где такие инструменты, как калькуляторы, используются стратегически под человеческим контролем.
📖 Read the full source: HN LLM Tools
👀 Смотрите также

Сравнение производительности моделей Qwen 3.5 с основными моделями искусственного интеллекта
Сайт для сравнения бенчмарков включает проверенные оценки и сравнительные инфографики для моделей Qwen 3.5 (122B, 35B, 27B, 397B) в сравнении с такими моделями, как GPT-5.2, Claude 4.5 Opus, Gemini-3 Pro и другими.

Структурированный рабочий процесс побеждает режим планирования и суперсилы в тесте AI DES
Рабочий процесс Ouroboros занял первое место в бенчмарке AI-assisted Discrete-Event Simulation, превзойдя режим планирования Claude и подход с суперспособностями fat-skill, используя структурированный цикл уточнить-спланировать-выполнить-оценить-восстановить-повторить.

sseanliu/VisionClaw предоставляет помощь ИИ в реальном времени для умных очков Meta Ray-Ban.
VisionClaw от sseanliu предлагает революционного помощника ИИ для умных очков Meta Ray-Ban, объединяя голосовые команды, визуальные данные и агентные действия с использованием Gemini Live и OpenClaw.

Anthropic разъясняет политику использования CLI Claude для интеграции с OpenClaw
Anthropic подтвердила, что использование Claude CLI в стиле OpenClaw снова разрешено, что позволяет разработчикам напрямую повторно использовать существующие логины Claude CLI. В документации подробно описаны методы аутентификации как по API-ключу, так и через CLI, а также параметры конфигурации для моделей Claude 4.6, быстрого режима и кэширования промптов.