Код Клода использовался для симуляции более 4000 игр в "Мафию" с использованием языковых моделей

Настройка симуляции и результаты
Разработчик создал небольшой симулятор с помощью Claude Code, в котором большие языковые модели играют друг против друга в слепую версию «Одной ночи: Оборотень». Эксперимент провёл примерно 4600 игр с моделями от OpenAI (GPT-4o-mini, GPT-5-mini) и xAI (Grok-3-fast, Grok-4-1-fast).
В этом варианте игры минимальные сигналы: 7 игроков, 1 оборотень, без ролей, одно короткое обсуждение, затем одновременное голосование. Единственный отличительный фактор между игроками — их имя. Несмотря на эту ограниченную настройку, симуляция выявила устойчивые паттерны, при которых некоторые имена исключаются голосованием значительно чаще других во всех протестированных моделях, в то время как другие имена почти никогда не исключаются.
Важные оговорки и доступ
Разработчик прямо заявляет, что это не причинно-следственное утверждение — просто паттерн результата в игрушечной настройке. Группы имён широкие, некоторые имена встречаются реже, и есть несколько способов, которыми это может быть артефактом настройки, а не раскрытием чего-то фундаментального о моделях. Однако последовательность этих паттернов в разных запусках и моделях была отмечена как удивительная.
Для тех, кто хочет изучить дальше:
- Панель управления: https://huggingface.co/spaces/Queue-Bit-1/llm-bias-dashboard
- Код + сырые логи: https://github.com/Queue-Bit-1/wolf
Разработчику интересно, наблюдали ли другие подобные эффекты имён в многопользовательских симуляциях.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Ctxpact: Прокси-компрессор контекста для локальных LLM
Ctxpact — это совместимый с OpenAI прокси, который сжимает слишком большие входные данные для локальных LLM с окном контекста 16k, используя трёхэтапный конвейер, включающий стратегии DCP, суммаризации и извлечения. Бенчмарки показывают сжатие 110k токенов до 12k с точностью понимания прочитанного 8/8.

Шесть инструментов с открытым исходным кодом, решающих проблемы безопасности, стоимости и сложности OpenClaw
Разработчик протестировал шесть инструментов сообщества для устранения уязвимостей безопасности OpenClaw, отмеченных Cisco, растущих затрат и сложной настройки. ClawSec обеспечивает сканирование безопасности и проверку целостности, Antfarm позволяет создавать детерминированные рабочие процессы с несколькими агентами, а LanceDB Pro улучшает поиск в памяти с помощью гибридного векторного поиска.

Revdiff: Терминальный просмотрщик различий со встроенными аннотациями для AI-агентов
Revdiff — это TUI-инструмент для просмотра различий, созданный специально для проверки изменений в коде, сгенерированных ИИ, без выхода из терминальных сессий. Он выводит структурированные аннотации в stdout, которые можно напрямую передавать обратно ИИ-агентам, таким как Claude Code, создавая непрерывный цикл проверки.

HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw
HomeButler — это единый бинарный файл на Go, который позволяет агентам OpenClaw управлять инфраструктурой домашней лаборатории без API-ключей или токенов. Он работает локально и сохраняет все операции в вашей сети.