Покемон Шоудаун ИИ-агенты, созданные с использованием бесплатных LLM API и вызова инструментов

Разработчик создал систему, в которой LLM, такие как Llama 3, Qwen и Gemma, автономно играют в бои Pokémon Showdown. Агенты каждый ход анализируют полное состояние боя — соответствие типов, HP, погоду, условия поля, раскрытую информацию о противнике — и решают, атаковать или сменить покемона, используя структурированные вызовы инструментов.
Ключевые детали
- Вся маршрутизация через LiteLLM с использованием только моделей с бесплатными API-уровнями (Groq, Cerebras, OpenRouter, Google AI Studio).
- Нулевая стоимость инференса при локальном запуске.
- Два режима: Человек против ИИ (игра против бота) и ИИ против ИИ (сражение двух моделей друг с другом).
- Из коробки поддерживается более 15 бесплатных моделей.
- Полная наблюдаемость через Langfuse для просмотра точных вызовов инструментов и рассуждений на каждом ходу.
Особенности архитектуры
Агент использует вызовы инструментов для структурирования решений — вместо простого взаимодействия «запрос-ответ» необработанные данные поля передаются в LLM, которая затем выбирает действия атаки или смены через предопределенные схемы инструментов. Это позволяет рассуждать о сложных состояниях доски, таких как преимущества типов и динамические полевые эффекты.
GitHub Репозиторий
Код и инструкции по настройке: github.com/MohamedMostafa259/pokemon-ai-agent
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Исправление раздувания контекста в автопамяти Claude Code с помощью схемы именования и скрипта аудита
Навык Claude Code внедряет схему именования из 3 типов, обязательные поля frontmatter и bash-скрипт аудита для дедупликации файлов памяти и снижения нагрузки на контекст.

Разработчик достиг задержки менее секунды для STT/TTS с локальными серверами Whisper и Coqui-TTS.
Разработчик опубликовал в открытом доступе реализации локальных серверов для Whisper STT и Coqui TTS, которые обеспечивают задержку ~0,2 секунды при преобразовании речи в текст и ~250 мс при преобразовании текста в речь, что позволяет создавать разговорные ИИ-агенты без зависимости от облачных сервисов.

ИИ поглотил уровень перевода: Организационная структура после внедрения агентов
Ажей Гор утверждает, что ИИ не заменил должности — он поглотил задачу перевода. Середина оргструктуры (инженерные менеджеры, scrum-мастера, tech-лиды) сокращается, так как агенты напрямую преобразуют требования в код.

Создание устойчивой инфраструктуры знаний на основе ИИ с помощью OpenClaw
Разработчик создал 'Brain' — центральную службу знаний с локальным RAG, координацией нескольких агентов и типизированной системой плагинов — для решения проблемы отсутствия состояния в AI-настройках. Система полностью работает на локальном оборудовании с использованием Ollama, Postgres, MongoDB, Qdrant и Memgraph.