변호사들이 계속 AI가 조작한 사례를 인용하는 이유: 개발자의 시각

✍️ OpenClawRadar📅 게시일: May 23, 2026🔗 Source
변호사들이 계속 AI가 조작한 사례를 인용하는 이유: 개발자의 시각
Ad

출처: Scientific American 기사(2026년 5월)에 따르면, AI가 가상의 법률 인용을 환각한 1,400건 이상의 법원 판례가 보고되었습니다. 변호사들은 경고에도 불구하고 계속 이러한 자료를 제출하고 있습니다. 이는 법조계만의 문제가 아닙니다. 저널리스트, 개발자, 연구자들도 피해를 입고 있습니다.

기사 주요 통계

  • 1,400건 이상의 사례: 지난 3년간 판사가 제출 서류에서 AI 오류를 명시적으로 언급한 경우(HEC 파리 연구원 Damien Charlotin 조사). 분기당 350~400건의 결정에 달했으며, 이후 정체됨.
  • 예: 앨라배마 대법원은 AI가 생성한 가상 판례를 인용한 변호사를 제재했지만, 해당 변호사는 중단을 약속한 직후 바로 다음 문장에서 존재하지 않는 판례를 인용했습니다.
  • 또 다른 변호사는 AI 환각을 사용하지 말라는 경고를 받은 제재를 받았습니다.

AI 신뢰 편향 연구

  • 이미지 분류 연구(2026년 2월): 조언이 AI로부터 왔다고 들은 참가자들은 AI에 대해 긍정적인 태도를 가질 때 더 나쁜 성과를 보였습니다. 조언이 인간에게서 왔다고 들은 그룹은 그러한 효과가 없었습니다. AI 안내는 "특정 편향을 유발하는 능력"이 있습니다.
  • 드론 공격 시뮬레이션(Penn State Wagner 연구실): 참가자들은 처음에는 민간인과 전투원을 정확히 분류했지만, 봇이 무작위 피드백을 주자 의견을 바꿨습니다—대부분의 경우 봇이 틀렸습니다. 그들은 어린이와 미사일 공격 이미지가 포함된 이 작업을 진지하게 수행했습니다.
Ad

AI 코딩 에이전트에 대한 시사점

이는 단순한 법률적 호기심이 아닙니다. 개발자가 코드 생성, 디버깅, 테스트를 위해 AI 에이전트에 의존할 때도 동일한 신뢰 역학이 적용됩니다. 주요 시사점:

  • 자동화 편향은 실제입니다. 인간은 기계가 오류를 범할 수 있다는 사실을 알면서도 기계 출력을 과도하게 신뢰합니다.
  • 거짓 긍정은 설득력 있어 보입니다: AI는 그럴듯한 헛소리(가상의 사건명, 그럴듯한 가짜 함수 시그니처, 발명된 API)를 환각합니다. 전통적 검증은 구조적으로 그럴듯한 것을 잡아내지 못합니다.
  • 코드에도 제재가 있습니다: 환각된 코드를 배포하면 중단, 보안 허점, 규정 위반이 발생할 수 있습니다. 법원 제재와 달리, 먼저 경고를 받지 못할 수도 있습니다.
  • 정체, 하락 아님: 법원에서의 AI 오류 비율은 인식이 확산된 후에도 높게 유지되었습니다. 개발 팀에서도 동일한 패턴이 발생할 가능성이 큽니다. 인식만으로는 충분하지 않습니다.

실용적 완화 방법: 모든 AI 출력을 초안으로 취급하십시오. 자동화된 교차 확인(예: 알려진 패키지 레지스트리, 문서, 테스트 스위트)을 구현하십시오. 프로덕션에 도달하기 전에 환각을 탐지하는 가드레일을 구축하십시오.

📖 전체 소스 읽기: HN LLM Tools

Ad

👀 See Also

칸 영화 제작비 50만 달러, 그중 40만 달러는 AI 컴퓨팅 비용
News

칸 영화 제작비 50만 달러, 그중 40만 달러는 AI 컴퓨팅 비용

칸 영화제에 상영된 한 영화는 제작비가 50만 달러였지만, 그중 40만 달러가 AI 컴퓨팅 비용으로 사용되었습니다. 생성형 비디오 파이프라인을 구축하는 AI 에이전트 개발자에게 주목할 만한 비용 벤치마크입니다.

OpenClawRadar
NVIDIA 베라 CPU, 에이전트 AI 워크로드를 위해 출시
News

NVIDIA 베라 CPU, 에이전트 AI 워크로드를 위해 출시

NVIDIA가 에이전트 AI 및 강화 학습 워크로드를 위해 특별히 설계된 프로세서인 Vera CPU를 출시했습니다. 기존 랙 규모 CPU 대비 50% 더 빠른 성능과 두 배의 효율성을 제공한다고 주장합니다.

OpenClawRadar
Cowork는 Claude Opus에 대해 사용자 설정을 무시하고 중간 노력도를 하드코딩합니다.
News

Cowork는 Claude Opus에 대해 사용자 설정을 무시하고 중간 노력도를 하드코딩합니다.

Max 플랜 사용자가 Cowork 기능이 --effort medium --model claude-opus-4-6를 하드코딩된 CLI 플래그로 전달하여 환경 변수와 settings.json 재정의를 무시한다는 사실을 발견했습니다. 이는 사용자들이 높은 노력 수준과 100만 컨텍스트 접근을 위해 비용을 지불했음에도 불구하고 중간 노력 수준과 표준 컨텍스트 창에 고정되어 있음을 의미합니다.

OpenClawRadar
SSD 스트리밍을 통해 M5 Max에서 Qwen3.5-397B의 속도를 20.34 tok/s로 향상시킨 Autoresearch
News

SSD 스트리밍을 통해 M5 Max에서 Qwen3.5-397B의 속도를 20.34 tok/s로 향상시킨 Autoresearch

한 개발자가 MacBook Pro M5 Max(128GB RAM)에서 SSD 스트리밍과 36번의 체계적인 실험을 통해 209GB Qwen3.5-397B 모델에 대해 초당 20.34 토큰의 추론 속도를 달성했습니다. 이 결과는 M5 Max 기준선 대비 2배, 원래 M3 Max 결과 대비 4.67배의 속도 향상을 나타냅니다.

OpenClawRadar