Agents IA de Pokemon Showdown construits avec des API LLM gratuites et appel d'outils

✍️ OpenClawRadar📅 Publié: May 1, 2026🔗 Source
Agents IA de Pokemon Showdown construits avec des API LLM gratuites et appel d'outils
Ad

Un développeur a construit un système où des LLM comme Llama 3, Qwen et Gemma jouent de manière autonome à des combats Pokémon Showdown. Les agents analysent l'état complet du combat à chaque tour — affinités de type, PV, météo, conditions de terrain, informations adverses révélées — et décident d'attaquer ou de changer de Pokémon en utilisant des appels d'outils structurés.

Points clés

  • Achemine tout via LiteLLM et utilise exclusivement des modèles avec des niveaux d'API gratuits (Groq, Cerebras, OpenRouter, Google AI Studio).
  • Coût d'inférence zéro pour une exécution locale.
  • Deux modes : Humain vs. IA (jouer contre le bot) et IA vs. IA (opposer deux modèles l'un à l'autre).
  • Prend en charge plus de 15 modèles gratuits prêts à l'emploi.
  • Observabilité complète via Langfuse pour voir les appels d'outils exacts et le raisonnement à chaque tour.
Ad

Points forts de l'architecture

L'agent utilise l'appel d'outils pour structurer les décisions — plutôt qu'une simple réponse par prompt — les données brutes du champ de bataille sont fournies au LLM, qui sélectionne ensuite les actions d'attaque ou de changement via des schémas d'outils prédéfinis. Cela permet de raisonner sur des états de plateau complexes comme les avantages de type et les effets de terrain dynamiques.

Dépôt GitHub

Code et instructions de configuration : github.com/MohamedMostafa259/pokemon-ai-agent

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

BaseLayer : Pipeline de Compression Comportementale Open-Source pour les Systèmes de Mémoire IA
Tools

BaseLayer : Pipeline de Compression Comportementale Open-Source pour les Systèmes de Mémoire IA

BaseLayer est un pipeline open-source qui extrait les croyances, comportements, tensions et contradictions des conversations, journaux et textes publiés, les comprimant en un profil d'identité pour les modèles d'IA. Il a été testé sur des ensembles de données allant de 8 entrées de journal personnel à de grands corpus comme les lettres aux actionnaires de Warren Buffett (350 000 mots) et les mémos d'investissement de Howard Marks (600 000 mots).

OpenClawRadar
Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI
Tools

Cadre de Prompt Visuel Remplace les Prompts Textuels par une Image Unique pour Claude AI

Le Principe de Capacité de Charge v9 est un cadre structurel bidirectionnel qui utilise une seule image de diagramme de flux au lieu d'invites textuelles pour Claude IA. Il fournit un diagnostic structurel ou des plans de construction génératifs basés sur les paramètres du système ou les objectifs.

OpenClawRadar
Serveur MCP pour les données des trains italiens : retards en temps réel, départs et horaires dans Claude
Tools

Serveur MCP pour les données des trains italiens : retards en temps réel, départs et horaires dans Claude

Un développeur a créé un serveur MCP non officiel pour Trenitalia qui fournit cinq outils pour interroger les données des trains italiens via Claude, y compris les tableaux de départ/arrivée en temps réel, le suivi des trains et les horaires enrichis avec les retards en direct.

OpenClawRadar
Gestionnaire multi-comptes open-source pour CLI Claude permettant la commutation de profils
Tools

Gestionnaire multi-comptes open-source pour CLI Claude permettant la commutation de profils

claude-multi-account est un outil CLI qui crée des profils isolés pour différents comptes Claude, permettant de basculer instantanément sans se déconnecter. Il prend en charge les paramètres partagés, la sauvegarde cloud et fonctionne sur Windows, Linux, macOS et Termux.

OpenClawRadar