AI가 만든 1,400건 가짜 판례: 변호사가 환각을 믿는 이유

출처: Scientific American 기사(2026년 5월)에 따르면, AI가 가상의 법률 인용을 환각한 1,400건 이상의 법원 판례가 보고되었습니다. 변호사들은 경고에도 불구하고 계속 이러한 자료를 제출하고 있습니다. 이는 법조계만의 문제가 아닙니다. 저널리스트, 개발자, 연구자들도 피해를 입고 있습니다.

기사 주요 통계

1,400건 이상의 사례: 지난 3년간 판사가 제출 서류에서 AI 오류를 명시적으로 언급한 경우(HEC 파리 연구원 Damien Charlotin 조사). 분기당 350~400건의 결정에 달했으며, 이후 정체됨.
예: 앨라배마 대법원은 AI가 생성한 가상 판례를 인용한 변호사를 제재했지만, 해당 변호사는 중단을 약속한 직후 바로 다음 문장에서 존재하지 않는 판례를 인용했습니다.
또 다른 변호사는 AI 환각을 사용하지 말라는 경고를 받은 후 제재를 받았습니다.

AI 신뢰 편향 연구

이미지 분류 연구(2026년 2월): 조언이 AI로부터 왔다고 들은 참가자들은 AI에 대해 긍정적인 태도를 가질 때 더 나쁜 성과를 보였습니다. 조언이 인간에게서 왔다고 들은 그룹은 그러한 효과가 없었습니다. AI 안내는 "특정 편향을 유발하는 능력"이 있습니다.
드론 공격 시뮬레이션(Penn State Wagner 연구실): 참가자들은 처음에는 민간인과 전투원을 정확히 분류했지만, 봇이 무작위 피드백을 주자 의견을 바꿨습니다—대부분의 경우 봇이 틀렸습니다. 그들은 어린이와 미사일 공격 이미지가 포함된 이 작업을 진지하게 수행했습니다.

AI 코딩 에이전트에 대한 시사점

이는 단순한 법률적 호기심이 아닙니다. 개발자가 코드 생성, 디버깅, 테스트를 위해 AI 에이전트에 의존할 때도 동일한 신뢰 역학이 적용됩니다. 주요 시사점:

자동화 편향은 실제입니다. 인간은 기계가 오류를 범할 수 있다는 사실을 알면서도 기계 출력을 과도하게 신뢰합니다.
거짓 긍정은 설득력 있어 보입니다: AI는 그럴듯한 헛소리(가상의 사건명, 그럴듯한 가짜 함수 시그니처, 발명된 API)를 환각합니다. 전통적 검증은 구조적으로 그럴듯한 것을 잡아내지 못합니다.
코드에도 제재가 있습니다: 환각된 코드를 배포하면 중단, 보안 허점, 규정 위반이 발생할 수 있습니다. 법원 제재와 달리, 먼저 경고를 받지 못할 수도 있습니다.
정체, 하락 아님: 법원에서의 AI 오류 비율은 인식이 확산된 후에도 높게 유지되었습니다. 개발 팀에서도 동일한 패턴이 발생할 가능성이 큽니다. 인식만으로는 충분하지 않습니다.

실용적 완화 방법: 모든 AI 출력을 초안으로 취급하십시오. 자동화된 교차 확인(예: 알려진 패키지 레지스트리, 문서, 테스트 스위트)을 구현하십시오. 프로덕션에 도달하기 전에 환각을 탐지하는 가드레일을 구축하십시오.

📖 전체 소스 읽기: HN LLM Tools