Код Клода использовался для симуляции более 4000 игр в "Мафию" с использованием языковых моделей

✍️ OpenClawRadar📅 Опубликовано: 27 февраля 2026 г.🔗 Source
Код Клода использовался для симуляции более 4000 игр в "Мафию" с использованием языковых моделей
Ad

Настройка симуляции и результаты

Разработчик создал небольшой симулятор с помощью Claude Code, в котором большие языковые модели играют друг против друга в слепую версию «Одной ночи: Оборотень». Эксперимент провёл примерно 4600 игр с моделями от OpenAI (GPT-4o-mini, GPT-5-mini) и xAI (Grok-3-fast, Grok-4-1-fast).

В этом варианте игры минимальные сигналы: 7 игроков, 1 оборотень, без ролей, одно короткое обсуждение, затем одновременное голосование. Единственный отличительный фактор между игроками — их имя. Несмотря на эту ограниченную настройку, симуляция выявила устойчивые паттерны, при которых некоторые имена исключаются голосованием значительно чаще других во всех протестированных моделях, в то время как другие имена почти никогда не исключаются.

Ad

Важные оговорки и доступ

Разработчик прямо заявляет, что это не причинно-следственное утверждение — просто паттерн результата в игрушечной настройке. Группы имён широкие, некоторые имена встречаются реже, и есть несколько способов, которыми это может быть артефактом настройки, а не раскрытием чего-то фундаментального о моделях. Однако последовательность этих паттернов в разных запусках и моделях была отмечена как удивительная.

Для тех, кто хочет изучить дальше:

  • Панель управления: https://huggingface.co/spaces/Queue-Bit-1/llm-bias-dashboard
  • Код + сырые логи: https://github.com/Queue-Bit-1/wolf

Разработчику интересно, наблюдали ли другие подобные эффекты имён в многопользовательских симуляциях.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Ctxpact: Прокси-компрессор контекста для локальных LLM
Инструменты

Ctxpact: Прокси-компрессор контекста для локальных LLM

Ctxpact — это совместимый с OpenAI прокси, который сжимает слишком большие входные данные для локальных LLM с окном контекста 16k, используя трёхэтапный конвейер, включающий стратегии DCP, суммаризации и извлечения. Бенчмарки показывают сжатие 110k токенов до 12k с точностью понимания прочитанного 8/8.

OpenClawRadar
Шесть инструментов с открытым исходным кодом, решающих проблемы безопасности, стоимости и сложности OpenClaw
Инструменты

Шесть инструментов с открытым исходным кодом, решающих проблемы безопасности, стоимости и сложности OpenClaw

Разработчик протестировал шесть инструментов сообщества для устранения уязвимостей безопасности OpenClaw, отмеченных Cisco, растущих затрат и сложной настройки. ClawSec обеспечивает сканирование безопасности и проверку целостности, Antfarm позволяет создавать детерминированные рабочие процессы с несколькими агентами, а LanceDB Pro улучшает поиск в памяти с помощью гибридного векторного поиска.

OpenClawRadar
Revdiff: Терминальный просмотрщик различий со встроенными аннотациями для AI-агентов
Инструменты

Revdiff: Терминальный просмотрщик различий со встроенными аннотациями для AI-агентов

Revdiff — это TUI-инструмент для просмотра различий, созданный специально для проверки изменений в коде, сгенерированных ИИ, без выхода из терминальных сессий. Он выводит структурированные аннотации в stdout, которые можно напрямую передавать обратно ИИ-агентам, таким как Claude Code, создавая непрерывный цикл проверки.

OpenClawRadar
HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw
Инструменты

HomeButler: Управление домашней лабораторией без использования токенов для агентов OpenClaw

HomeButler — это единый бинарный файл на Go, который позволяет агентам OpenClaw управлять инфраструктурой домашней лаборатории без API-ключей или токенов. Он работает локально и сохраняет все операции в вашей сети.

OpenClawRadar