Test Autonome de Super Mario Utilisant des Modèles Comportementaux

L'article explore les méthodes de test autonome utilisées dans Super Mario Bros., en employant une approche de modèle comportemental. Il s'agit d'une suite à une série en cours visant à perfectionner le jeu autonome et à terminer les niveaux sans intervention humaine. L'accent principal est mis sur l'utilisation d'un générateur d'entrées basé sur la mutation, qui inverse les bits dans les données d'entrée pour créer des scénarios variés afin de tester la réponse du jeu, révélant ainsi des situations limites qui pourraient passer inaperçues via les tests traditionnels.
Voici un extrait de code de la méthodologie :
import mario
import random
def generate_input(starting_byte, flip_probability, input_length):
input = []
next_byte = starting_byte
for _ in range(input_length):
for j in range(8):
if random.random() < flip_probability:
next_byte ^= (1 << j)
input.append(next_byte)
return input
Cette approche est conçue pour imiter un jeu réaliste, permettant à certaines touches de rester enfoncées sur plusieurs images, similairement à la façon dont les joueurs maintiennent 'déplacement à droite' tout en tapotant 'saut'. Une collection de chemins, représentée par des séquences d'entrées, est maintenue et rejouée sélectivement pour trouver un parcours optimal à travers le jeu. Une fonction de fitness simple favorise les chemins avec la position la plus élevée sur l'axe des x, mais en raison de potentielles impasses, un ensemble diversifié de chemins avec des scores variés est exploré pour assurer des tests complets.
Cette technique est particulièrement utile pour les développeurs impliqués dans le développement de jeux ou ceux intéressés par l'automatisation des tests, offrant des perspectives sur l'exploration efficace d'espaces d'états complexes.
📖 Lire la source complète : HN AI Agents
👀 See Also

Configuration OpenClaw Combine des Modèles Locaux, OpenAI et n8n pour des Opérations d'IA Économiques
Un développeur partage sa configuration OpenClaw utilisant OpenAI via OAuth pour un raisonnement de haute qualité, des modèles locaux pour les tâches quotidiennes et n8n pour les flux de travail automatisés, maintenant des coûts mensuels d'environ 20 $.

Les agents IA construisent indépendamment des garde-fous dans une expérience ouverte.
Un développeur a fait fonctionner 5 agents IA pendant 3 semaines avec une consigne ouverte pour résoudre des problèmes de développement. 28 prototypes sur plus de 170 ont convergé indépendamment vers la création de scanners de sécurité et de contrôles de coûts—des garde-fous que les agents ont créés pour eux-mêmes sans qu'on le leur demande.

Développeur crée une application de bureau Python de 3 106 lignes avec Claude Code en 3 semaines, sans expérience préalable en programmation.
Un développeur sans aucune connaissance en Python a créé une application de bureau de 3 106 lignes en trois semaines en utilisant Claude Code, décrivant les fonctionnalités section par section au cours d'une conversation de plus de 500 000 caractères. L'application gère l'approvisionnement en contenu, la journalisation, le suivi des métriques, la recherche, les jalons ludifiés et le déclenchement à distance depuis un téléphone.

Développement d'une Application SaaS par un Non-Développeur avec Claude comme Partenaire de Codage
Un directeur des opérations de données sans formation en développement logiciel a utilisé Claude pour construire et lancer une application SaaS complète appelée The Pit Preacher, un assistant de barbecue alimenté par l'IA avec Next.js 14, l'authentification Supabase, les paiements Stripe et le déploiement Vercel.