Agents IA de Pokemon Showdown construits avec des API LLM gratuites et appel d'outils

Un développeur a construit un système où des LLM comme Llama 3, Qwen et Gemma jouent de manière autonome à des combats Pokémon Showdown. Les agents analysent l'état complet du combat à chaque tour — affinités de type, PV, météo, conditions de terrain, informations adverses révélées — et décident d'attaquer ou de changer de Pokémon en utilisant des appels d'outils structurés.
Points clés
- Achemine tout via LiteLLM et utilise exclusivement des modèles avec des niveaux d'API gratuits (Groq, Cerebras, OpenRouter, Google AI Studio).
- Coût d'inférence zéro pour une exécution locale.
- Deux modes : Humain vs. IA (jouer contre le bot) et IA vs. IA (opposer deux modèles l'un à l'autre).
- Prend en charge plus de 15 modèles gratuits prêts à l'emploi.
- Observabilité complète via Langfuse pour voir les appels d'outils exacts et le raisonnement à chaque tour.
Points forts de l'architecture
L'agent utilise l'appel d'outils pour structurer les décisions — plutôt qu'une simple réponse par prompt — les données brutes du champ de bataille sont fournies au LLM, qui sélectionne ensuite les actions d'attaque ou de changement via des schémas d'outils prédéfinis. Cela permet de raisonner sur des états de plateau complexes comme les avantages de type et les effets de terrain dynamiques.
Dépôt GitHub
Code et instructions de configuration : github.com/MohamedMostafa259/pokemon-ai-agent
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

BaseLayer : Pipeline de Compression Comportementale Open-Source pour les Systèmes de Mémoire IA
BaseLayer est un pipeline open-source qui extrait les croyances, comportements, tensions et contradictions des conversations, journaux et textes publiés, les comprimant en un profil d'identité pour les modèles d'IA. Il a été testé sur des ensembles de données allant de 8 entrées de journal personnel à de grands corpus comme les lettres aux actionnaires de Warren Buffett (350 000 mots) et les mémos d'investissement de Howard Marks (600 000 mots).

Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI
Le Principe de Capacité de Charge v9 est un cadre structurel bidirectionnel qui utilise une seule image de diagramme de flux au lieu d'invites textuelles pour Claude IA. Il fournit un diagnostic structurel ou des plans de construction génératifs basés sur les paramètres du système ou les objectifs.

Serveur MCP pour les données des trains italiens : retards en temps réel, départs et horaires dans Claude
Un développeur a créé un serveur MCP non officiel pour Trenitalia qui fournit cinq outils pour interroger les données des trains italiens via Claude, y compris les tableaux de départ/arrivée en temps réel, le suivi des trains et les horaires enrichis avec les retards en direct.

Gestionnaire multi-comptes open-source pour CLI Claude permettant la commutation de profils
claude-multi-account est un outil CLI qui crée des profils isolés pour différents comptes Claude, permettant de basculer instantanément sans se déconnecter. Il prend en charge les paramètres partagés, la sauvegarde cloud et fonctionne sur Windows, Linux, macOS et Termux.