Teste Autônomo de Super Mario Usando Modelos de Comportamento

O artigo explora os métodos de teste autônomo utilizados em Super Mario Bros., empregando uma abordagem de modelo comportamental. Esta é uma continuação de uma série em andamento que visa aperfeiçoar a jogabilidade autônoma e completar níveis sem intervenção humana. O foco principal é usar um gerador de entrada baseado em mutação, que inverte bits nos dados de entrada para criar cenários variados para testar a resposta do jogo, revelando situações extremas que poderiam passar despercebidas em testes tradicionais.
Aqui está um trecho de código da metodologia:
import mario
import random
def generate_input(starting_byte, flip_probability, input_length):
input = []
next_byte = starting_byte
for _ in range(input_length):
for j in range(8):
if random.random() < flip_probability:
next_byte ^= (1 << j)
input.append(next_byte)
return input
Esta abordagem foi projetada para imitar a jogabilidade realista, permitindo que certas teclas permaneçam pressionadas em múltiplos quadros, semelhante a como os jogadores mantêm 'mover para a direita' enquanto pressionam 'pular'. Uma coleção de caminhos, representada por sequências de entrada, é mantida e reproduzida seletivamente para encontrar um curso ideal através do jogo. Uma função de aptidão simples favorece caminhos com a posição mais alta no eixo x, mas devido a possíveis becos sem saída, um conjunto diversificado de caminhos com pontuações variadas é explorado para garantir um teste abrangente.
Esta técnica é particularmente útil para desenvolvedores envolvidos no desenvolvimento de jogos ou para aqueles interessados em automação de testes, oferecendo insights sobre a exploração eficiente de espaços de estado complexos.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Sistema de Gerenciamento de Projetos Pessoais Usando Claude Code e Obsidian: Arquitetura e Perguntas
Um desenvolvedor descreve um sistema operacional pessoal de três camadas usando Claude Code como motor de ingestão, Obsidian para rastreamento de conhecimento e OneDrive para armazenamento de arquivos, com comandos específicos como /daily e /pm-sync para rotear entradas e tarefas de gerenciamento de projetos.

Codificação de Vibes em uma Plataforma de Logística Empresarial de $20k/Ano com Claude e Superpoderes
TRMNL substituiu o ShipHero por Claude e Superpowers em menos de um mês, construindo um sistema de atendimento personalizado com integrações UPS, FedEx, DHL e USPS por $100 em tokens.

Construindo um Rastreador de Demissões em IA com Claude Cowork: Detalhes de Implementação Prática
Um desenvolvedor criou um rastreador de demissões ao vivo e interativo que coleta e exibe empresas que citam IA como motivo para cortes de empregos em 2026, usando Claude Cowork para gerar estruturas de tabela, depurar lógica de filtros e otimizar acessibilidade móvel.

Lições práticas da automação de prospecção no LinkedIn com OpenClaw
Um desenvolvedor compartilha lições aprendidas com dificuldade após três semanas de automação de prospecção no LinkedIn com o OpenClaw, abordando a detecção de automação do LinkedIn, períodos de aquecimento de contas, pontuação de ICP com sinais de intenção, nuances de limitação de taxa e design de fluxo de conversa.