Автономные ИИ-агенты Pokémon Showdown на Llama 3, Qwen, Gemma

Разработчик создал систему, в которой LLM, такие как Llama 3, Qwen и Gemma, автономно играют в бои Pokémon Showdown. Агенты каждый ход анализируют полное состояние боя — соответствие типов, HP, погоду, условия поля, раскрытую информацию о противнике — и решают, атаковать или сменить покемона, используя структурированные вызовы инструментов.

Ключевые детали

Вся маршрутизация через LiteLLM с использованием только моделей с бесплатными API-уровнями (Groq, Cerebras, OpenRouter, Google AI Studio).
Нулевая стоимость инференса при локальном запуске.
Два режима: Человек против ИИ (игра против бота) и ИИ против ИИ (сражение двух моделей друг с другом).
Из коробки поддерживается более 15 бесплатных моделей.
Полная наблюдаемость через Langfuse для просмотра точных вызовов инструментов и рассуждений на каждом ходу.

Особенности архитектуры

Агент использует вызовы инструментов для структурирования решений — вместо простого взаимодействия «запрос-ответ» необработанные данные поля передаются в LLM, которая затем выбирает действия атаки или смены через предопределенные схемы инструментов. Это позволяет рассуждать о сложных состояниях доски, таких как преимущества типов и динамические полевые эффекты.