围棋选手自废武功向AI投降:作弊如何变得无法察觉

Статья LessWrong «Как игроки в го лишают себя права на ИИ» Эша Васкеса Нуньеса исследует социологию читерства с помощью ИИ на турнирах по го, сосредоточившись на конкретном случае из чемпионата европейских команд. Извлечены ключевые моменты:
Предыстория: AlphaGo против Ли Седоля
В марте 2016 года AlphaGo от Google DeepMind победила чемпиона мира Ли Седоля со счетом 4-1. Поначалу казалось, что культура го адаптируется аналогично шахматам, где ИИ используется для комментариев и обучения, не подрывая человеческие соревнования. Однако читерство незаметно проявилось.
Дело Карло Метты
- Хронология: В начале 2018 года рефери чемпионата Европы среди команд обвинил итальянского игрока Карло Метту в использовании ИИ во время онлайн-матча.
- Использованный ИИ: Leela 0.11 (доступная до появления движков на основе статьи AlphaGo) и позже Leela Zero (сверхчеловеческий движок с открытым исходным кодом).
- Доказательства: Обвинители утверждали, что его выбор ходов слишком близок к Leela 0.11, с существенным разрывом между его онлайн-игрой (похожей на ИИ) и игрой на доске (человеческой). Однако доказательства были представлены плохо в ветке Facebook.
- Итог: Метта был первоначально забанен, но после апелляции итальянской команды его оправдали из-за косвенных доказательств и негативной реакции сообщества на стигму обвинений в читерстве с ИИ.
- Последствия: Уровень игры Метты на доске остался прежним, но его онлайн-результаты резко выросли: серия 9-0 в 2018/2019, 9-1 в 2019/2020 и 25 из 26 побед в последующие годы. Единственное поражение было под видеонаблюдением. В статье отмечается, что среди неитальянских европейских игроков в го уже практически не оспаривается, что Метта регулярно использовал ИИ с 2018 года.
Как читерство стало тривиальным
- Публичная травля читеров с ИИ дала обратный эффект, сделав обвинения социально затратными.
- Дело Метты создало прецедент, когда даже очевидное читерство могло остаться безнаказанным из-за политического давления.
- В результате в европейских онлайн-турнирах практически отсутствовал контроль, что делало читерство тривиально простым.
Разработчикам инструментов для обеспечения честности ИИ в соревновательных играх следует учитывать, как adversarial dynamics может сделать обнаружение и наказание неэффективными. Социологические факторы — стигма, прецеденты и организационная инерция — так же важны, как технические методы обнаружения.
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Сообщество NVIDIA DGX Spark запускает Spark Arena для воспроизводимых тестов LLM.
Сообщество NVIDIA DGX Spark запустило Spark Arena — воспроизводимую таблицу лидеров для оценки производительности открытых больших языковых моделей с использованием стандартизированных инструментов и методологии. Среди текущих лидеров — gpt-oss-120b и Qwen3-Coder-Next.

Данные об использовании подписки Claude Max на 100 долларов для задачи расширения API
Пользователь подписки Claude Max за $100 сообщает, что потратил 13% от 5-часовой сессии на расширение существующего API функциональностью избранных библиотек, при этом использование контекста составило 11%, а недельное использование увеличилось с 5% до 6%.

GM увольняет 600 IT-работников и нанимает инженеров по ИИ для разработки агентов и моделей
General Motors уволила 600 IT-сотрудников (~10% отдела), чтобы нанять работников с навыками в области ИИ: разработка агентов, дата-инжиниринг, облачный инжиниринг, промпт-инжиниринг.

1,2 млрд локальная модель превзошла 1 трлн облачных в покере: агрессия побеждает знания в формате "ол-ин или пас"
Модель Liquid с 1,2 млрд параметров выиграла 2 из 5 турниров по Техасскому Холдему против моделей до 1 трлн параметров, потому что в формате с короткими стеками постоянный колл принёс больше фишек, чем умная игра.