Evolução por Autojogo: Claude Code Cria IA de Jogos (130 Iterações)

Resultados da Competição e Abordagem

Um desenvolvedor usou o Claude Code como sua equipe de desenvolvimento inteira para a Game AI Cup, uma competição de programação onde os participantes escrevem bots para um jogo baseado em física 2D. O bot gerado pelo Claude ficou em 6º lugar entre 83 participantes em três rodadas.

A abordagem foi inspirada no conceito de autoresearch de Karpathy, onde um agente LLM itera no código durante a noite. O desenvolvedor construiu uma pequena estrutura chamada autoevolve que adapta isso para domínios de autojogo — em vez de otimizar uma única métrica, as versões competem entre si cara a cara.

O Loop de Evolução

O fluxo de trabalho seguiu este loop:

O Claude Code lê o bot atual
Analisa por que perdeu partidas específicas
Propõe uma alteração direcionada
A nova versão é comparada com versões anteriores
Mantém ou descarta a versão
Repete o processo

O desenvolvedor executou aproximadamente 130 iterações ao longo de várias semanas em três rodadas da competição.

Principais Descobertas do Experimento

Alterações estruturais superaram ajustes de parâmetros: Cada avanço envolveu adicionar novas capacidades como controle preditivo de modelo, um papel de goleiro ou planejamento consciente de energia. Dezenas de ajustes de limite e peso foram neutros ou negativos. O progresso foi mais rápido ao guiar o Claude para "adicionar um novo comportamento" em vez de "ajustar este número".

Comportamentos emergentes eram legíveis no código: Depois que o Claude corrigiu uma função de custo de energia, o otimizador começou a usar quiques nas paredes para inverter a direção — quicar nas paredes dá uma mudança de direção gratuita sem gastar energia. Esse comportamento nunca foi explicitamente programado, mas é totalmente legível no código, diferentemente de abordagens de rede neural que criariam uma caixa preta.

Correções de bugs se acumulam isoladamente: Misturar correções de bugs com mudanças de estratégia introduziu ruído. Duas correções de precisão sozinhas em uma versão venceram todos os principais concorrentes, mas as mesmas correções agrupadas com uma mudança de estratégia em outra versão foram neutras.

O registro de alterações foi essencial: Cada versão incluía a proposta do Claude, o resultado esperado, o resultado real e as lições aprendidas. Isso permitiu que o desenvolvedor dissesse ao Claude "essa abordagem falhou três vezes, pare de tentá-la" e evitasse repetir experimentos fracassados.

Aplicações Mais Amplas

O desenvolvedor descobriu a lista awesome-autoresearch mostrando padrões similares de "LLM itera no código durante a noite" aplicados em outros lugares: o CEO da Shopify alcançou 53% mais rápido de renderização de modelos com 93 commits automatizados, alguém escalou kernels CUDA de 18 para 187 TFLOPS, e o Vesuvius Challenge o usou para decifrar rolos antigos.

Começando com o Autoevolve

A estrutura autoevolve funciona como uma habilidade do Claude Code. Instale-a com:

npx skills add MrTsepa/autoevolve

Em seguida, diga ao Claude para configurar um experimento de evolução. A estrutura lida com classificações, combinação de partidas, rastreamento de fronteira de Pareto e visualização.

📖 Leia a fonte completa: r/ClaudeAI

O Framework Autoevolve Utiliza o Código Claude para o Desenvolvimento de IA em Jogos por Meio de Evolução por Autojogo

Resultados da Competição e Abordagem

O Loop de Evolução

Principais Descobertas do Experimento

Aplicações Mais Amplas

Começando com o Autoevolve

👀 See Also

O agente de IA OpenClaw auto-hospedado cria um sistema de responsabilidade passiva para desenvolvedores.

Executando Gemma 4 como um Agente Autônomo Local com Claude Code em 16GB de VRAM

Construindo um Sistema Autônomo de Pesquisa em ML Produtivo com Claude Code

Como Scripts de Teste Frágeis Causaram Atrasos na Liberação e o que uma Equipe Fez a Respeito