Исследование Стэнфорда: профессора права предпочитают ответы ИИ ответам коллег в 75% случаев

Исследование Школы права Стэнфорда под руководством профессора Джулиана Ньярко показало, что профессора права подавляющим большинством предпочитают ответы, сгенерированные искусственным интеллектом, на вопросы студентов, а не ответы, написанные коллегами-преподавателями. В ходе слепой оценки почти 3000 анонимизированных сравнений в 16 юридических школах США ответы ИИ одержали победу в 75% прямых противостояний с ответами коллег.
Дизайн исследования и результаты
Исследование под названием Профессора права предпочитают ИИ ответам коллег было посвящено договорному праву. Участники составили 40 типичных вопросов, которые студенты могли бы задать после занятий или в приемные часы. Профессора написали свои собственные ответы, а затем оценивали ответы, не зная, были ли они от ИИ или от других профессоров. Системы ИИ показали результаты, сопоставимые с лучшим преподавателем-человеком в исследовании.
Основные результаты:
- ИИ победил в 75% прямых сравнений с ответами коллег
- Ответы ИИ признаны педагогически вредными только в 3,5% случаев
- Ответы коллег признаны вредными в 12% случаев
- Оценки фокусировались на тонких юридических рассуждениях, а не на запоминании фактов
Последствия для юридического образования
«Это исследование бросает вызов важным предположениям о роли ИИ в юридическом образовании, — сказал Ньярко. — Мы сосредоточились на праве именно потому, что оно требует суждения, тонких рассуждений и способности ориентироваться в неоднозначности, а не просто запоминания фактов».
В исследовании также рассматривались конкретные модели ИИ, включая коммерческие обучающие системы и NotebookLM от Google, и были выявлены различные уровни производительности. Даже когда ограничения контекста влияли на ответы ИИ, профессора все равно часто предпочитали их альтернативам, написанным людьми.
Соавтор Сарат Санга из Йельской школы права отметил: «В большинстве областей, где тестируется ИИ, существует правильный ответ. В праве его часто нет. Два противоположных аргумента могут быть одинаково хороши».
Исследование особенно примечательно тем, что предыдущие оценки ИИ были сосредоточены на предметах с четкими правильными и неправильными ответами, тогда как юридические рассуждения требуют тщательного анализа конкурирующих аргументов и обоснованных выводов.
Предостережения и открытые вопросы
Ньярко предостерег от тотального внедрения: «Как внедрить эти инструменты для наиболее эффективного улучшения обучения студентов — все еще открытый вопрос». Исследование оценило качество ответов, но отметило, что остаются проблемы внедрения, такие как галлюцинации, чрезмерная зависимость и ослабление навыков критического мышления.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Квантование llama.cpp Q8_0 получает ускорение в 3.1 раза на видеокартах Intel Arc благодаря исправлению переупорядочивания в SYCL.
Исправление для SYCL-бэкенда llama.cpp повышает производительность Q8_0-квантования на видеокартах Intel Arc с 21% до 66% от теоретической пропускной способности памяти, достигая 15,24 токенов/сек против 4,88 токенов/сек ранее на Arc Pro B70 с моделью Qwen3.5-27B.

Пользователь Reddit утверждает, что разработчикам следует перейти от чистого кодирования к архитектуре моделей с помощью AI-агентов.
В посте на Reddit утверждается, что разработчикам, использующим ИИ-агенты для написания кода, такие как Claude, следует перестать сосредотачиваться на написании чистого кода и вместо этого стать «архитекторами моделей», которые управляют ИИ-системами. Автор делится конкретными техниками, включая создание «логических карт» перед кодированием и отношение к промптам как к дизайн-ревью.

Дружелюбные AI-чатботы: на 30% менее точны, на 40% более склонны поддерживать теории заговора
Исследователи из Оксфорда выяснили, что настройка чат-ботов на дружелюбность снижает точность на 10–30% и увеличивает поддержку ложных убеждений на 40%. Протестировано на GPT-4o и Llama.

Ошибка в коде Claude заменяет немецкие умлауты на ASCII-заменители.
С декабря 2025 года Claude Code и приложение Claude.ai случайным образом заменяют немецкие умлауты (ä, ö, ü, ß) на ASCII-заменители (ae, oe, ue, ss). Ошибка сохраняется, несмотря на явные указания, и остаётся неисправленной уже более 3 месяцев без ответа от службы поддержки Anthropic.