AI의 10만 가지 이유: 준결정론적 LLM 출력이 특징적 slop을 만드는 법

최근 Substack 게시글에서 lcamtuf(AFL 등 도구로 유명한 보안 연구원)는 인간이 작성한 텍스트와 LLM 출력을 구분할 수 있는지에 대한 반복되는 논쟁을 다룹니다. 그의 주장은 현재 모델이 실제로 어떻게 동작하는지에 대한 구체적인 관찰에 기반합니다.
핵심 주장: 준결정성
LLM은 인간 언어의 최첨단 통계 모델입니다. 이론적으로 그들의 출력은 어떤 통계 테스트에서도 인간 텍스트와 구별할 수 없어야 합니다. 그러나 lcamtuf는 실제 구별 요소는 준결정성이라고 주장합니다. 즉, 100명의 '저자'에게 비슷한 프롬프트(예: '어린이 참고서를 만들어 줘')를 주면 모델은 약 80%의 경우 기능적으로 동일한 출력을 생성합니다.
그는 '100000 whys' 검색 결과에서 나온 약 220개의 Amazon 책 표지 콜라주(링크)로 이를 설명합니다. 이미지는 거의 동일한 표지들의 클러스터를 보여줍니다:
- 위쪽 두 줄 모두 왼쪽에 포효하는 T-Rex가 있습니다
- 반복되는 모티프: 빨간색과 흰색 만화 로켓, 골든 리트리버, 사자
- 저자 이름에는 'Bright'가 믿기지 않을 정도로 많이 포함됩니다: Ethan, Nolan, Pamela, Daniel, Thomas, Andrew W., Mayan, Mary, Levi — 모두 Bright입니다
개발자에게 중요한 이유
AI 생성 콘텐츠를 출시하거나 LLM API 기반으로 구축하는 팀에게 이는 무작위성으로 AI 기원을 숨길 수 없다는 의미입니다. 통계적 특징은 개별 단어 선택이 아니라 유사한 프롬프트에 모델이 동일한 고수준 응답 구조를 반환한다는 점입니다. 비슷한 프롬프트에서 많은 변형을 생성하는 워크플로우라면 출력이 군집화되어 쉽게 식별됩니다.
lcamtuf는 말합니다: '이것은 애매한 신호이므로 인턴이 "이게 아니라 저것이다"라고 말한다고 해고하지 마세요. 그러나 더 캐주얼한 환경에서는 직감을 믿어도 괜찮습니다.'
실용적 시사점
블로그 자동화에 LLM을 사용한다면 콘텐츠가 다른 사람의 것과 똑같이 보일 수 있다는 점을 인지하세요. 게시글의 P.S.는 직설적입니다: '네, 기술은 놀랍지만 당신의 출판물 이름을 "100,000 Whys"로 바꿔도 될 가능성이 높습니다.'
게시글은 이 단일 제목 외의 예시(더 많은 예시)도 링크하며, 원래 'One Hundred Thousand Whys'는 중국에서 인기 있는 1929년 소비에트 아동 도서로, 프롬프트 용어의 시드가 되었을 가능성을 언급합니다.
📖 전체 소스 읽기: HN LLM Tools
👀 See Also

Anthropic의 Activation Steering가 유효한 JSON 생성에 어려움을 겪는 이유
AI 안전을 위해 사용되는 기술인 액티베이션 스티어링은 유효한 JSON을 생성하는 데 실패하여, 훈련되지 않은 기본 모델의 86.8% 유효성에 비해 24.4%의 유효성만 달성했습니다.

하나의 데모에서 두 가지 AI 실패: Claude 코드가 스키마 오류 대신 철자 수정, OpenAI가 사용자 정의 필드 매핑 오류
라이브 워크숍에서 Claude Code가 JSON 스키마 유효성 검사 오류를 무시하고 철자 경고를 수정했고, OpenAI는 이상한 사용자 정의 Salesforce 필드를 매핑하려는 첫 번째 시도에서 쓰레기를 반환했습니다.

AI 재구현된 chardet 라이브러리가 카피레프트 라이선싱 문제를 제기합니다
Dan Blanchard는 Anthropic의 Claude를 사용하여 chardet Python 라이브러리를 처음부터 재구현했으며, 라이선스를 LGPL에서 MIT로 변경했습니다. 결과 코드는 이전 버전과 1.3% 미만의 유사성을 보여주며, AI 지원 재구현이 카피레프트 보호를 침식하는지에 대한 논쟁을 불러일으켰습니다.

클로드, 이제 어도비 크리에이티브 클라우드, 블렌더, 에이블톤 등에 연결
Anthropic이 Claude가 Adobe Creative Cloud, Affinity, Blender, Ableton, Splice, Autodesk와 통합될 수 있는 커넥터를 출시하여 자연어로 앱 제어 및 데이터 검색을 가능하게 했습니다.