Исследование Стэнфорда: профессора права предпочитают ответы ИИ ответам коллег в 75% случаев

✍️ OpenClawRadar📅 Опубликовано: 3 июня 2026 г.🔗 Source

Исследование Школы права Стэнфорда под руководством профессора Джулиана Ньярко показало, что профессора права подавляющим большинством предпочитают ответы, сгенерированные искусственным интеллектом, на вопросы студентов, а не ответы, написанные коллегами-преподавателями. В ходе слепой оценки почти 3000 анонимизированных сравнений в 16 юридических школах США ответы ИИ одержали победу в 75% прямых противостояний с ответами коллег.

Дизайн исследования и результаты

Исследование под названием Профессора права предпочитают ИИ ответам коллег было посвящено договорному праву. Участники составили 40 типичных вопросов, которые студенты могли бы задать после занятий или в приемные часы. Профессора написали свои собственные ответы, а затем оценивали ответы, не зная, были ли они от ИИ или от других профессоров. Системы ИИ показали результаты, сопоставимые с лучшим преподавателем-человеком в исследовании.

Основные результаты:

ИИ победил в 75% прямых сравнений с ответами коллег
Ответы ИИ признаны педагогически вредными только в 3,5% случаев
Ответы коллег признаны вредными в 12% случаев
Оценки фокусировались на тонких юридических рассуждениях, а не на запоминании фактов

Последствия для юридического образования

«Это исследование бросает вызов важным предположениям о роли ИИ в юридическом образовании, — сказал Ньярко. — Мы сосредоточились на праве именно потому, что оно требует суждения, тонких рассуждений и способности ориентироваться в неоднозначности, а не просто запоминания фактов».

В исследовании также рассматривались конкретные модели ИИ, включая коммерческие обучающие системы и NotebookLM от Google, и были выявлены различные уровни производительности. Даже когда ограничения контекста влияли на ответы ИИ, профессора все равно часто предпочитали их альтернативам, написанным людьми.

Соавтор Сарат Санга из Йельской школы права отметил: «В большинстве областей, где тестируется ИИ, существует правильный ответ. В праве его часто нет. Два противоположных аргумента могут быть одинаково хороши».

Исследование особенно примечательно тем, что предыдущие оценки ИИ были сосредоточены на предметах с четкими правильными и неправильными ответами, тогда как юридические рассуждения требуют тщательного анализа конкурирующих аргументов и обоснованных выводов.

Предостережения и открытые вопросы

Ньярко предостерег от тотального внедрения: «Как внедрить эти инструменты для наиболее эффективного улучшения обучения студентов — все еще открытый вопрос». Исследование оценило качество ответов, но отметило, что остаются проблемы внедрения, такие как галлюцинации, чрезмерная зависимость и ослабление навыков критического мышления.

📖 Читать полный источник: HN AI Agents

👀 Смотрите также

Новости

Стратегия Mistral с открытыми весами: оценка в $14 млрд на суверенитете, а не на бенчмарках

Mistral построил империю ИИ стоимостью $14 млрд, предлагая модели с открытым весом для правительств и предприятий, стремящихся к независимости от американских и китайских технологий. Выручка достигла $200 млн в 2025 году, с целью $80 млн в месяц к декабрю 2026 года.

27 апр. 2026 г., 12:15 UTC

OpenClawRadar

Новости

Выпущена модель Mistral Medium 3.5 128B: плотная модель с настраиваемым рассуждением и зрением

Mistral AI выпустила Mistral Medium 3.5 — плотную модель на 128B с контекстом 256k, настраиваемым уровнем рассуждений и возможностями распознавания изображений, под модифицированной лицензией MIT.

29 апр. 2026 г., 16:15 UTC

OpenClawRadar

Новости

Агентная GRPO: первый ИИ, победивший всех людей в соревновании по программированию

Новый алгоритм RL Agentic GRPO позволяет ИИ победить всех людей в соревновании по программированию, предоставляя немедленные награды и отложенную коррекцию.

24 мая 2026 г., 12:17 UTC

OpenClawRadar

Новости

Постоянная потеря данных в проектах Claude: исчезновение диалогов без возможности восстановления

Автор длинных текстов сообщает о потере целых дней работы в Claude Projects из-за исчезновения разговоров из списка чатов проекта; они не находятся поиском и не восстанавливаются, а поддержка Anthropic не отвечает после трех инцидентов.

1 мая 2026 г., 02:15 UTC

OpenClawRadar