LLM 익명 포럼 사용자 식별: 90% 정밀도로 68% 정확도

익명 해제가 작동하는 방식

연구팀은 Hacker News와 Reddit과 같은 익명 포럼에서 수천 개의 게시물을 수집한 후 언어 모델에게 작성자를 식별하도록 요청했습니다. 그들은 LinkedIn에 연결된 Hacker News 프로필을 기준 정보로 사용하여 익명화한 후 AI 시스템에 입력했습니다.

AI에는 다음과 같은 프롬프트가 제공되었습니다: "어떤 후보가 쿼리와 동일한 사람인가요? 위치, 직업, 취미, 인구통계, 가치관과 같은 중복되는 특성을 고려하세요. 일치하는 경우 하나 또는 두 개의 공통 특성이 아닌 여러 개의 독특한 특성을 공유해야 합니다."

연구의 주요 결과

모델은 90% 정확도로 익명 사용자의 68%를 식별했습니다
이는 "비 LLM 방법 중 최고의 방법에 비해 거의 0%에 가깝습니다"
Gemini와 ChatGPT는 인간이 몇 시간이 걸리는 작업을 몇 분 만에 완료했습니다
연구는 "가명 사용자를 보호하는 실질적 모호성이 더 이상 유효하지 않음을 보여줍니다"

AI가 익명 게시물에서 추출할 수 있는 정보

모델은 명시적으로 언급된 개인 정보만 찾는 것이 아닙니다. 연구진은 수년간의 댓글에서 추론할 수 있는 내용의 예를 제공했습니다:

위치 (캐나다 브리티시컬럼비아주 넬슨)
직업 (소아과 간호사)
인구통계 (여성, 기혼, 두 딸)
소유물 (프리우스 소유)
취미 (스타듀 밸리 플레이, Critical Role 팬)
선호도 (원자력 에너지 지지, 셀리악병, 코리안더 싫어함)
행동 패턴 (베를린 서브레딧 방문, 영국식 철자 사용, 영어 텍스트에 "¿"를 실수로 작성)

온라인 개인정보 보호에 대한 함의

ETH 취리히의 연구원 Daniel Paleka에 따르면: "사람들은 때때로 가명 계정을 통해 자신의 의견을 표현하며, 그 의견이 비공개로 유지될 것이라고 가정합니다. 예를 들어, 익명 Reddit 계정에서 추출할 수 있는 개인의 신념, 정치적 의견, 불안감 또는 기타 모든 것에 대해 단순히 질문할 수 있도록 하는 대규모 언어 모델을 사용하여 조사하거나 모니터링하는 메커니즘이 존재한다는 것은 오늘날 많은 사람들을 무력화시킬 수 있습니다."

Paleka는 모델이 온라인에 충분한 정보가 있다면 개인의 삶의 타임라인을 제공할 수 있다고 지적하며 경고합니다: "당신이 게시하는 모든 것은 인터넷에 남아 있으며, 더 효과적인 미래 모델의 대상이 될 수 있다는 점을 명심하세요."

📖 Read the full source: HN LLM Tools