교수, 클로드 코드로 AI 탐지 편향 게임 제작하다

프로젝트 개요
영국 대학의 정교수가 학생 제출물에 AI 탐지 도구를 사용하는 경험을 시뮬레이션하는 브라우저 기반 게임 'Flagged'를 개발했습니다. 이 교수는 교육 분야 AI 탐지를 연구하며, 플레이어가 시뮬레이션된 학생들에게 영향을 미치는 결정을 내릴 때 추상적인 오탐률 통계가 어떻게 구체화되는지 보여주기 위해 이 대화형 데모를 만들었습니다.
게임 메커니즘
플레이어는 대학이 AI 탐지 도구로 열두 건의 학생 제출물을 검사한 조교수 역할을 맡습니다. 각 제출물은 확률 점수와 함께 반환됩니다. 플레이어는 해당 제출물을 조사 대상으로 표시할지 통과시킬지 결정해야 합니다. 선택적으로 각 학생의 파일을 열어 전공, 배경, 상황에 대한 정보를 확인한 후 결정할 수 있습니다.
핵심 학습 결과는 플레이어가 탐지 점수만 볼 때와 학생 파일을 읽은 후 내리는 결정이 다르다는 점을 발견할 때 나타납니다. 교수가 지적했듯이: "모든 표시는 실제 사람에게 영향을 미칩니다."
기술 구현
전체 프로젝트는 Claude Code로 구축되었으며, 바닐라 JavaScript와 CSS가 포함된 단일 HTML 파일로 구성됩니다. 프레임워크나 종속성이 없습니다. Claude Code는 교수의 디자인과 게임 로직을 바탕으로 모든 코드를 작성했습니다.
개발 통찰
교수에 따르면 Claude Code 사용에서 가장 어려운 부분은 코딩 자체가 아니라, 게임이 플레이어를 불편하게 만들어야 한다는 점을 Claude가 이해하도록 하는 것이었습니다. 교수는 Claude가 결과를 완화하거나 안심시키는 언어를 추가하려는 경향에 반복적으로 맞서야 했습니다. 교수는 강조했습니다: "학생을 잘못 표시할 때 안심시켜주는 언어는 전혀 없어야 합니다."
교육적 맥락
이 게임은 AI 탐지 도구가 영어 비원어민에게 최대 61.3%의 오탐률을 보인다는 연구 결과를 다룹니다. 교수는 이 통계가 우려스럽지만, 사람들이 직접 의사 결정 과정을 경험하기 전에는 충분히 공감되지 않는다고 지적했습니다.
게임은 라이브 상태이며 https://samillingworth.itch.io/flagged에서 무료로 플레이할 수 있습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

에르메스 vs 오픈클로: 차이는 속도가 아닌 개성이다
한 개발자가 Hermes와 OpenClaw를 나란히 비교하며, 각각이 identity를 처리하는 방식이 핵심 차이점이라고 말합니다. Hermes는 기억을 저장하고, OpenClaw는 soul.md를 통해 성격 측면을 저장합니다.

비기술 창업자가 클로드로 슬로우 픽션 앱 제작: 리액트 네이티브, 분기 로직, 수익화
전 인도주의 활동가가 Claude를 사용하여 하루에 하나의 장면과 분기 선택지, 주변 사운드스케이프를 제공하고 폭식 메커니즘이 없는 느린 소설 앱 'The Parallel'을 구축했습니다.

클로드 게임 개발 로그: 에이전트 기반 Three.js 개발 교훈과 기술 스택
한 개발자가 Claude AI를 전적으로 사용하여 Three.js 라인 라이더 게임을 구축한 실용적인 교훈을 공유합니다. 여기에는 Git 워크트리, TypeScript 우선 접근 방식, AI 한계를 위한 관리자 슬라이더, 그리고 Firebase, WebSockets, 결정론적 록스텝 시뮬레이션을 사용한 기술 스택이 포함됩니다.

LLM으로 7년간의 일기 분석하기: RAG 대 미세 조정 실패
2019년부터 일기를 써온 개발자가 200개 이상의 항목을 LLM에 넣어 패턴을 발견하려고 시도했다. RAG는 실패했고, 파인튜닝도 실패했으며, 프라이버시도 제약이었다. 최종 접근법은 2년마다 반복되는 인생 교훈을 밝혀냈다.