Stanford-Studie: Rechtsprofessoren bevorzugen KI-Antworten in 75 % der Fälle gegenüber Kollegen

Eine Studie der Stanford Law School unter der Leitung von Professor Julian Nyarko ergab, dass Juraprofessoren KI-generierte Antworten auf Studentenfragen denen von menschlichen Dozenten deutlich vorziehen. In einer Blindauswertung von knapp 3.000 anonymisierten Vergleichen an 16 US-amerikanischen juristischen Fakultäten gewannen KI-Antworten 75 % der direkten Vergleiche gegen Antworten von Kollegen.
Studiendesign & Ergebnisse
Die Studie mit dem Titel Law Professors Prefer AI Over Peer Answers konzentrierte sich auf Vertragsrecht. Die Teilnehmer erstellten 40 repräsentative Fragen, die Studenten nach dem Unterricht oder in Sprechstunden stellen könnten. Professoren schrieben eigene Antworten und bewerteten dann Antworten, ohne zu wissen, ob sie von der KI oder anderen Professoren stammten. Die KI-Systeme schnitten vergleichbar mit dem besten menschlichen Dozenten der Studie ab.
Wichtigste Ergebnisse:
- KI gewann 75 % der direkten Vergleiche gegen Antworten von Kollegen
- KI-Antworten wurden nur zu 3,5 % als pädagogisch schädlich eingestuft
- Antworten von Kollegen wurden zu 12 % als schädlich eingestuft
- Die Bewertungen konzentrierten sich auf nuancierte juristische Argumentation, nicht auf Faktenwissen
Auswirkungen auf die juristische Ausbildung
“Diese Studie stellt wichtige Annahmen über die Rolle der KI in der juristischen Ausbildung in Frage”, sagte Nyarko. “Wir haben uns bewusst auf das Recht konzentriert, weil es Urteilsvermögen, nuanciertes Denken und die Fähigkeit erfordert, mit Unklarheiten umzugehen – nicht nur Faktenwissen.”
Die Forschung untersuchte auch spezifische KI-Modelle, darunter kommerzielle Tutorensysteme und Googles NotebookLM, und stellte unterschiedliche Leistungsniveaus fest. Selbst wenn Kontextbeschränkungen die KI-Antworten beeinträchtigten, bevorzugten die Professoren sie dennoch häufig gegenüber menschlichen Alternativen.
Koautor Sarath Sanga von der Yale Law School merkte an: “In den meisten Bereichen, in denen KI getestet wird, gibt es eine richtige Antwort. Im Recht gibt es die oft nicht. Zwei gegensätzliche Argumente können beide gut sein.”
Die Studie ist besonders bemerkenswert, da frühere KI-Bewertungen sich auf Fächer mit klaren Richtig-/Falsch-Antworten konzentrierten, während juristische Argumentation eine sorgfältige Analyse konkurrierender Argumente und vertretbarer Schlussfolgerungen erfordert.
Warnungen & offene Fragen
Nyarko warnte vor einer unkritischen Übernahme: “Wie man diese Werkzeuge am effektivsten einsetzt, um das Lernen der Studenten zu verbessern, ist noch eine offene Frage.” Die Studie bewertete die Antwortqualität, wies jedoch darauf hin, dass Herausforderungen wie Halluzinationen, übermäßiges Vertrauen und die Erosion kritischer Denkfähigkeiten bestehen bleiben.
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Microsoft kündigt Claude-Code-Lizenzen – KI-Agenten zu teuer für Skalierung
Microsoft kündigt die meisten direkten Claude Code-Lizenzen und verlagert Ingenieure auf GitHub Copilot CLI. Uber hat sein KI-Budget für 2026 in vier Monaten aufgebraucht. Die Token-Kosten pro Aufgabe könnten tatsächlich steigen.

Claudes Fünf-Sitz-Minimum schafft Privatsphärenlücke für Einzelpraktizierende
Die geschäftlichen Datenschutzbestimmungen von Anthropic erfordern ein Minimum von fünf Arbeitsplätzen, was Einzelunternehmer dazu zwingt, entweder für ungenutzte Plätze zu zahlen oder Verbraucherpläne mit unzureichenden Datenschutzbestimmungen zu nutzen. Diese Lücke steht im Gegensatz zu Google Workspace und OpenAI Business Plans, die unternehmensweiten Datenschutz zu Einzelplatzpreisen anbieten.

Apple Silicon Benchmark: Leistung von Qwen3-VL auf M3, M4 und M5 Max für Vision-LLM-Klassifizierung
Benchmark-Ergebnisse zeigen die Klassifizierungsleistung des Qwen3-VL Vision-LLM auf Apple Silicon: M3 Max und M4 Studio sind bei 8B-Modellen nahezu identisch, während der M5 Max 75-83 % schneller ist. Die Speicherbandbreite ist für die Token-Generierung wichtiger als für das Prefill bei Vision-Aufgaben.

KI frisst die Welt (Frühjahr 2026) – Eine umfassende Marktanalyse
Ein ausführlicher PDF-Bericht über Trends, Marktgrößen und Einführungsmetriken der KI-Branche für das Frühjahr 2026, mit Fokus auf Schlüsseltechnologien, Akteure und Prognosen.