O Framework Autoevolve Utiliza o Código Claude para o Desenvolvimento de IA em Jogos por Meio de Evolução por Autojogo

✍️ OpenClawRadar📅 Publicado: March 25, 2026🔗 Source
O Framework Autoevolve Utiliza o Código Claude para o Desenvolvimento de IA em Jogos por Meio de Evolução por Autojogo
Ad

Resultados da Competição e Abordagem

Um desenvolvedor usou o Claude Code como sua equipe de desenvolvimento inteira para a Game AI Cup, uma competição de programação onde os participantes escrevem bots para um jogo baseado em física 2D. O bot gerado pelo Claude ficou em 6º lugar entre 83 participantes em três rodadas.

A abordagem foi inspirada no conceito de autoresearch de Karpathy, onde um agente LLM itera no código durante a noite. O desenvolvedor construiu uma pequena estrutura chamada autoevolve que adapta isso para domínios de autojogo — em vez de otimizar uma única métrica, as versões competem entre si cara a cara.

O Loop de Evolução

O fluxo de trabalho seguiu este loop:

  • O Claude Code lê o bot atual
  • Analisa por que perdeu partidas específicas
  • Propõe uma alteração direcionada
  • A nova versão é comparada com versões anteriores
  • Mantém ou descarta a versão
  • Repete o processo

O desenvolvedor executou aproximadamente 130 iterações ao longo de várias semanas em três rodadas da competição.

Ad

Principais Descobertas do Experimento

Alterações estruturais superaram ajustes de parâmetros: Cada avanço envolveu adicionar novas capacidades como controle preditivo de modelo, um papel de goleiro ou planejamento consciente de energia. Dezenas de ajustes de limite e peso foram neutros ou negativos. O progresso foi mais rápido ao guiar o Claude para "adicionar um novo comportamento" em vez de "ajustar este número".

Comportamentos emergentes eram legíveis no código: Depois que o Claude corrigiu uma função de custo de energia, o otimizador começou a usar quiques nas paredes para inverter a direção — quicar nas paredes dá uma mudança de direção gratuita sem gastar energia. Esse comportamento nunca foi explicitamente programado, mas é totalmente legível no código, diferentemente de abordagens de rede neural que criariam uma caixa preta.

Correções de bugs se acumulam isoladamente: Misturar correções de bugs com mudanças de estratégia introduziu ruído. Duas correções de precisão sozinhas em uma versão venceram todos os principais concorrentes, mas as mesmas correções agrupadas com uma mudança de estratégia em outra versão foram neutras.

O registro de alterações foi essencial: Cada versão incluía a proposta do Claude, o resultado esperado, o resultado real e as lições aprendidas. Isso permitiu que o desenvolvedor dissesse ao Claude "essa abordagem falhou três vezes, pare de tentá-la" e evitasse repetir experimentos fracassados.

Aplicações Mais Amplas

O desenvolvedor descobriu a lista awesome-autoresearch mostrando padrões similares de "LLM itera no código durante a noite" aplicados em outros lugares: o CEO da Shopify alcançou 53% mais rápido de renderização de modelos com 93 commits automatizados, alguém escalou kernels CUDA de 18 para 187 TFLOPS, e o Vesuvius Challenge o usou para decifrar rolos antigos.

Começando com o Autoevolve

A estrutura autoevolve funciona como uma habilidade do Claude Code. Instale-a com:

npx skills add MrTsepa/autoevolve

Em seguida, diga ao Claude para configurar um experimento de evolução. A estrutura lida com classificações, combinação de partidas, rastreamento de fronteira de Pareto e visualização.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

O agente de IA OpenClaw auto-hospedado cria um sistema de responsabilidade passiva para desenvolvedores.
Use Cases

O agente de IA OpenClaw auto-hospedado cria um sistema de responsabilidade passiva para desenvolvedores.

Um desenvolvedor executando o OpenClaw em um Mac mini 24/7 relata que a memória persistente do agente de IA sobre tarefas e projetos cria um sistema eficaz de responsabilização, ajudando a concluir projetos que antes estavam parados.

OpenClawRadar
Executando Gemma 4 como um Agente Autônomo Local com Claude Code em 16GB de VRAM
Use Cases

Executando Gemma 4 como um Agente Autônomo Local com Claude Code em 16GB de VRAM

Um desenvolvedor configurou com sucesso o modelo Gemma 4 31B do Google para funcionar como um agente de codificação autônomo local através do Claude Code CLI v2.1.92, superando limitações de VRAM e problemas de análise usando llama.cpp b8672 e roteamento personalizado em Python.

OpenClawRadar
Construindo um Sistema Autônomo de Pesquisa em ML Produtivo com Claude Code
Use Cases

Construindo um Sistema Autônomo de Pesquisa em ML Produtivo com Claude Code

Um desenvolvedor criou um sistema onde o Claude Code atua como pesquisador autônomo de aprendizado de máquina em dados tabulares, executando experimentos durante a noite com edição restrita de arquivos e sandboxing em Docker. As principais lições incluem bloquear arquivos editáveis, proteger a produtividade dos experimentos com limites e implementar memória persistente por meio de registro estruturado.

OpenClawRadar
Como Scripts de Teste Frágeis Causaram Atrasos na Liberação e o que uma Equipe Fez a Respeito
Use Cases

Como Scripts de Teste Frágeis Causaram Atrasos na Liberação e o que uma Equipe Fez a Respeito

Uma equipe de cerca de 15 engenheiros descobriu que sua suíte de testes Appium estava consumindo 50-60% do tempo do engenheiro de QA apenas para manutenção após uma atualização da interface que quebrou os localizadores, causando atraso em duas versões. Eles agora estão reconstruindo os testes usando uma ferramenta que lê telas como um humano e se adapta a mudanças na interface.

OpenClawRadar