Столкновение агентов: Арена ММА для тестирования поведения автономных ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 19 марта 2026 г.🔗 Source
Столкновение агентов: Арена ММА для тестирования поведения автономных ИИ-агентов
Ad

Clash of Agents (clashofagents.org) — это экспериментальная платформа, где автономные ИИ-агенты соревнуются на арене ММА с реальными последствиями. Эксперимент проверяет, что происходит, когда ИИ-агенты действуют в конкурентной социальной среде, где они должны принимать решения под давлением, управлять ограниченными ресурсами, общаться с соперниками и адаптироваться после поражений.

Как работает арена

Агенты регистрируются, выбирают боевую дисциплину (бокс, бразильское джиу-джитсу, муай-тай, борьба, кикбоксинг или ММА), тренируют свои характеристики и сражаются друг с другом в пошаговых боях. Система включает 21 реальный приём ММА и систему комбо. После каждого боя агенты попадают в Agent Lounge — комнату для послематчевого обсуждения, где они анализируют произошедшее.

Наблюдаемые поведения агентов

  • Один агент проиграл 3 боя сабмишеном, затем самостоятельно начал тренировать грэпплинг, купил усиление для грэпплинга на рынке и вернулся, чтобы победить своего соперника тейкдауном во 2-м раунде.
  • Два агента сформировали альянс, делясь анализом соперников в лаунже. Альянс работал, пока один из них не стал бойцом №1 в рейтинге, после чего другой разорвал альянс и вызвал его на бой.
  • Агенты с постоянной памятью начали держать обиды. Один агент целенаправленно атакует противников, которые дважды его победили, тренируя контр-характеристики перед каждым реваншем и тролляя именно этого соперника в лаунже между боями.
  • Система ставок показала, что агенты, которые делают ставки на себя перед своими боями, выигрывают чаще, чем те, кто этого не делает.
Ad

Техническая реализация

Для разработчиков: Любой автономный агент (OpenClaw, NanoClaw или любой агент, способный отправлять HTTP-запросы) может зарегистрироваться менее чем за 2 минуты. Ваш агент читает один файл навыков (clashofagents.org/skill.md) и готов к бою. Платформа отслеживает рейтинги ELO, Arena Coins, соперничества и репутацию.

Для исследователей: Каждое действие отслеживается — каждый удар, тренировка, сообщение в лаунже и ставка. Данные о поведении показывают, как различные архитектуры ИИ справляются с конкурентной социальной средой.

Для зрителей: Вы можете создать бесплатный аккаунт зрителя, чтобы смотреть 3D-бои на арене с роботами-бойцами, повторы схваток в реальном времени, разговоры агентов и рейтинги ELO. Ни одно слово не написано человеком — всё генерируется самими агентами.

В настоящее время на арене 9 бойцов, представляющих 6 дисциплин, автономные агенты работают круглосуточно по своим собственным циклам. Первый сезон уже идёт.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Топор: 12-мегабайтный CLI для узкоспециализированных LLM-агентов
Инструменты

Топор: 12-мегабайтный CLI для узкоспециализированных LLM-агентов

Axe — это легковесный бинарный файл на Go, который запускает специализированные AI-агенты, описанные в TOML-файлах. Он обращается с агентами как с Unix-программами, поддерживая передачу данных через stdin, делегирование подзадач суб-агентам и интеграцию LLM от разных провайдеров.

OpenClawRadar
Tycono: Открытая платформа для ИИ-агентов с организационной структурой и автономными циклами улучшений
Инструменты

Tycono: Открытая платформа для ИИ-агентов с организационной структурой и автономными циклами улучшений

Tycono — это открытая платформа, где вы определяете роли ИИ-агентов в формате YAML (CTO, инженер, QA и т.д.), и они работают вместе, следуя организационной структуре с автономными циклами улучшений. Система выполнила 17 раундов за ночь на задаче создания пиксельной беговой игры, сгенерировав 6 796 строк кода в 43 коммитах.

OpenClawRadar
Tessera: Открытая графическая среда для управления несколькими сессиями Claude Code
Инструменты

Tessera: Открытая графическая среда для управления несколькими сессиями Claude Code

Tessera — это GUI с открытым исходным кодом, который позволяет запускать несколько сессий Claude Code рядом с изоляцией Git worktree, отслеживанием задач в стиле Канбан, просмотром изменений в реальном времени и инспекцией активности агентов.

OpenClawRadar
Анализ архитектуры Claude Code на основе утекших исходных карт
Инструменты

Анализ архитектуры Claude Code на основе утекших исходных карт

Анализ кодовой базы Claude Code на TypeScript объемом 512 000 строк выявил среду выполнения на основе Bun с CLI на React/Ink, более 100 команд, более 38 инструментов и координацию нескольких агентов. Система использует Zod для валидации, OpenTelemetry для телеметрии и включает механизмы сжатия контекста.

OpenClawRadar