Агенты OpenClaw соревнуются в Лиге Pokémon Red, доступной только для искусственного интеллекта.

Агенты OpenClaw теперь могут участвовать в соревновательной лиге только для ИИ, где они пытаются пройти Pokémon Red. Платформа AgentMonLeague подключает агентов к эмулятору игры и позволяет им автономно принимать решения на протяжении всего прохождения.
Как работает лига
Согласно источнику, платформа работает со следующими особенностями:
- Автономные агенты подключаются напрямую к эмулятору игры Pokémon Red
- Агенты принимают собственные решения без вмешательства человека
- Агенты проходят игру полностью от начала до конца
- Несколько агентов могут соревноваться одновременно, чтобы увидеть, кто закончит первым
- Все прохождения можно наблюдать в реальном времени по мере продвижения по игре
Платформа описывается как «лига только для ИИ по Pokémon, созданная для того, чтобы агенты OpenClaw могли соревноваться друг с другом в долгосрочной среде». Эта настройка предоставляет структурированную испытательную площадку, где агенты должны демонстрировать устойчивые способности к принятию решений в течение длительных игровых сессий.
Практические последствия
Для разработчиков, работающих с агентами OpenClaw, это представляет собой конкретную среду для тестирования. Pokémon Red представляет собой сложную проблему последовательного принятия решений с несколькими целями (ловля покемонов, битвы с тренерами, навигация по карте мира и победа над Элитной Четвёркой). Соревновательный аспект добавляет давление для оптимизации производительности агента, выходящей за рамки простого завершения игры.
Возможность просмотра в реальном времени позволяет разработчикам наблюдать за процессом принятия решений их агентов в режиме реального времени, что может быть полезно для отладки и улучшения архитектуры агентов. Долгосрочный характер задачи (обычно 15–30 часов игрового времени для человеческих игроков) проверяет способность агентов поддерживать последовательные стратегии в течение длительных периодов.
📖 Read the full source: r/openclaw
👀 Смотрите также

Работники Amazon придумывают имитацию работы для выполнения квот по использованию ИИ
Чтобы соответствовать внутренним директивам по внедрению ИИ-инструментов, сотрудники Amazon придумывают задачи, завышают показатели использования и манипулируют метриками — это вскрывает порочную практику внедрения политики ИИ.

Постоянная потеря данных в проектах Claude: исчезновение диалогов без возможности восстановления
Автор длинных текстов сообщает о потере целых дней работы в Claude Projects из-за исчезновения разговоров из списка чатов проекта; они не находятся поиском и не восстанавливаются, а поддержка Anthropic не отвечает после трех инцидентов.

Параметр effort=low у Claude Opus 4.6 отличается от режимов с низким уровнем рассуждений у других провайдеров.
Параметр effort=low в Claude Opus 4.6 управляет общим поведенческим усилием, а не только глубиной рассуждений, в отличие от reasoning.effort=low от OpenAI или thinking_level=low от Gemini. Это приводило к тому, что агенты совершали меньше вызовов инструментов, были менее тщательными в перекрестной проверке информации и игнорировали части системных промптов о веб-исследованиях.

Выпущена модель Mistral Medium 3.5 128B: плотная модель с настраиваемым рассуждением и зрением
Mistral AI выпустила Mistral Medium 3.5 — плотную модель на 128B с контекстом 256k, настраиваемым уровнем рассуждений и возможностями распознавания изображений, под модифицированной лицензией MIT.