Claude Code: Marco de Autoevolución para IA en Juegos (6º en Game AI Cup)

Resultados y Enfoque de la Competencia

Un desarrollador utilizó Claude Code como todo su equipo de desarrollo para la Game AI Cup, un concurso de programación competitiva donde los participantes escriben bots para un juego basado en física 2D. El bot generado por Claude obtuvo el 6º puesto entre 83 participantes a lo largo de tres rondas.

El enfoque se inspiró en el concepto de autoresearch de Karpathy, donde un agente LLM itera sobre el código durante la noche. El desarrollador construyó un pequeño marco llamado autoevolve que adapta esto para dominios de autojuego — en lugar de optimizar una sola métrica, las versiones compiten entre sí cara a cara.

El Bucle de Evolución

El flujo de trabajo siguió este bucle:

Claude Code lee el bot actual
Analiza por qué perdió partidos específicos
Propone un cambio específico
La nueva versión se evalúa frente a versiones anteriores
Mantener o descartar la versión
Repetir el proceso

El desarrollador ejecutó aproximadamente 130 iteraciones durante varias semanas a lo largo de tres rondas de competencia.

Hallazgos Clave del Experimento

Los cambios estructurales superaron los ajustes de parámetros: Cada avance importante implicó agregar nuevas capacidades como control predictivo de modelos, un rol de portero o planificación consciente de la energía. Docenas de ajustes de umbrales y pesos fueron planos o negativos. El progreso fue más rápido cuando se guiaba a Claude hacia "agregar un nuevo comportamiento" en lugar de "ajustar este número".

Los comportamientos emergentes eran legibles en el código: Después de que Claude corrigió una función de costo de energía, el optimizador comenzó a usar rebotes en las paredes para invertir la dirección — rebotar en las paredes proporciona un cambio de dirección gratuito sin gastar energía. Este comportamiento nunca fue programado explícitamente pero es completamente legible en el código, a diferencia de los enfoques de redes neuronales que crearían una caja negra.

Las correcciones de errores se acumulan en aislamiento: Mezclar correcciones de errores con cambios de estrategia introdujo ruido. Dos correcciones de precisión solas en una versión vencieron a todos los principales contendientes, pero las mismas correcciones combinadas con un cambio de estrategia en otra versión fueron planas.

El registro de cambios fue esencial: Cada versión incluía la propuesta de Claude, el resultado esperado, el resultado real y las lecciones aprendidas. Esto permitió al desarrollador decirle a Claude "este enfoque falló tres veces, deja de intentarlo" y evitar repetir experimentos fallidos.

Aplicaciones Más Amplias

El desarrollador descubrió la lista awesome-autoresearch que muestra patrones similares de "LLM itera sobre el código durante la noche" aplicados en otros lugares: el CEO de Shopify logró un 53% más rápido de renderizado de plantillas con 93 commits automatizados, alguien escaló kernels CUDA de 18 a 187 TFLOPS, y el Vesuvius Challenge lo utilizó para descifrar rollos antiguos.

Comenzando con Autoevolve

El marco autoevolve funciona como una habilidad de Claude Code. Instálalo con:

npx skills add MrTsepa/autoevolve

Luego dile a Claude que configure un experimento de evolución. El marco maneja calificaciones, emparejamientos, seguimiento del frente de Pareto y visualización.

📖 Leer la fuente completa: r/ClaudeAI

El Marco de Autoevolución Utiliza Código Claude para el Desarrollo de IA en Juegos Mediante Evolución de Autojuego.

Resultados y Enfoque de la Competencia

El Bucle de Evolución

Hallazgos Clave del Experimento

Aplicaciones Más Amplias

Comenzando con Autoevolve

👀 Ver también

Generación de Leads y Automatización de CRM con OpenClaw

Construyendo un Sistema de Investigación Agéntico con Claude Code: Una Implementación Práctica

Juego de curling basado en navegador creado con Claude Sonnet 4.5 por alguien que no es programador.

Puntos de referencia de decodificación especulativa en RTX 3090 con modelos Qwen para uso empresarial en HVAC