Claude CodeでLLM盲人狼シミュレーション：4,600ゲーム実行

シミュレーションの設定と結果

開発者がClaude Codeを使用して、大規模言語モデルが互いにブラインド・ワンナイト人狼をプレイする小さなシミュレーターを構築しました。この実験では、OpenAI（GPT-4o-mini、GPT-5-mini）とxAI（Grok-3-fast、Grok-4-1-fast）のモデルで約4,600ゲームが実行されました。

このゲームバリアントは最小限のシグナルしかありません：7人のプレイヤー、1人の人狼、役職なし、短い議論の後、同時投票が行われます。プレイヤー間の唯一の違いは名前だけです。この限られた設定にもかかわらず、シミュレーションでは、すべてのテストされたモデルで、一部の名前が他の名前よりも著しく頻繁に投票で脱落する一貫したパターンが明らかになりました。一方、他の名前はほとんど脱落しないことも分かりました。

重要な注意点とアクセス方法

開発者は、これは因果関係の主張ではなく、単なるおもちゃのような設定からの結果パターンであると明言しています。名前のグループは広範で、一部の名前は出現頻度が低く、この結果がモデルに関する根本的な何かを示しているのではなく、設定のアーティファクトである可能性が複数あります。しかし、これらのパターンが実行やモデルをまたいで一貫していることは驚くべきこととして指摘されています。

さらに探求したい方のために：