클로드 코드를 사용하여 LLM으로 4,000건 이상의 블라인드 웨어울프 게임 시뮬레이션

✍️ OpenClawRadar📅 게시일: February 27, 2026🔗 Source
클로드 코드를 사용하여 LLM으로 4,000건 이상의 블라인드 웨어울프 게임 시뮬레이션
Ad

시뮬레이션 설정 및 결과

한 개발자가 Claude Code를 사용해 대규모 언어 모델들이 서로 눈가리개 원나이트 웨어울프를 플레이하는 작은 시뮬레이터를 구축했습니다. 이 실험은 OpenAI(GPT-4o-mini, GPT-5-mini)와 xAI(Grok-3-fast, Grok-4-1-fast) 모델을 대상으로 약 4,600게임을 실행했습니다.

이 게임 변형은 최소한의 신호만을 가지고 있습니다: 7명의 플레이어, 1마리의 늑대, 역할 없음, 짧은 토론 한 번, 그 후 동시 투표입니다. 플레이어들 사이의 유일한 차별화 요소는 그들의 이름입니다. 이 제한된 설정에도 불구하고, 시뮬레이션은 일부 이름들이 테스트된 모든 모델에서 다른 이름들보다 훨씬 더 자주 투표로 제외되는 반면, 다른 이름들은 거의 제외되지 않는 일관된 패턴을 드러냈습니다.

중요한 주의사항 및 접근 방법

개발자는 이것이 인과 관계 주장이 아니라 장난감 설정에서 나온 결과 패턴일 뿐이라고 명시적으로 밝혔습니다. 이름 그룹은 광범위하며, 일부 이름은 덜 자주 나타나고, 이것이 모델에 관한 근본적인 것을 드러내기보다는 설정의 부산물일 수 있는 여러 방법이 있습니다. 그러나 이러한 패턴의 실행과 모델 간 일관성은 놀라운 것으로 지적되었습니다.

더 탐구하고 싶은 분들을 위해:

  • 대시보드: https://huggingface.co/spaces/Queue-Bit-1/llm-bias-dashboard
  • 코드 + 원시 로그: https://github.com/Queue-Bit-1/wolf

개발자는 다른 사람들도 다중 에이전트 시뮬레이션에서 유사한 이름 효과를 관찰했는지 궁금해합니다.

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

하이퍼리서치: 오픈소스 클로드 코드 스킬 하네스가 딥 리서치 에이전트로 변환시키다
Tools

하이퍼리서치: 오픈소스 클로드 코드 스킬 하네스가 딥 리서치 에이전트로 변환시키다

HyperResearch는 Claude Code를 16단계 심층 연구 파이프라인으로 변환하며, 지속적인 지식 저장소, 사실 확인, 인증된 웹 세션을 제공합니다. 오픈 소스, 단일 명령 설치로 DeepResearch Bench에서 OpenAI와 Google을 능가합니다.

OpenClawRadar
지문 인식의 AI 에이전트 개발자를 위한 무료 웹 봇 인증 테스트 도구
Tools

지문 인식의 AI 에이전트 개발자를 위한 무료 웹 봇 인증 테스트 도구

Fingerprint가 Web Bot Auth 구현을 테스트하기 위한 무료 공개 엔드포인트를 출시했습니다. 이 도구는 HTTP 요청의 암호화 서명을 검증하여 봇 및 AI 에이전트 개발자가 프로덕션 환경에 배포하기 전에 WBA 설정이 올바르게 작동하는지 확인할 수 있도록 돕습니다.

OpenClawRadar
코리 헤인스의 AI 에이전트를 위한 마케팅 스킬 세트
Tools

코리 헤인스의 AI 에이전트를 위한 마케팅 스킬 세트

OpenClaw에 AI 에이전트를 위한 25가지 마케팅 스킬 세트가 추가되었습니다. 이 세트는 전환 최적화, 카피라이팅, 분석, 성장 엔지니어링을 다루고 있습니다. 특히 전환 최적화 스킬은 다중 에이전트 설정에서 매우 효과적인 것으로 알려져 있습니다.

OpenClawRadar
클로드 IDE 브리지: 실시간 IDE 접근을 위한 웹소켓 도구
Tools

클로드 IDE 브리지: 실시간 IDE 접근을 위한 웹소켓 도구

claude-ide-bridge는 Claude Code를 IDE 내부 상태에 직접 연결하는 WebSocket 브리지로, 실시간 진단, 정의로 이동, 참조 찾기, 타입 호버링, 파일 열기, 중단점 관리 및 디버거 상태 스트리밍을 가능하게 합니다.

OpenClawRadar