El Marco de Autoevolución Utiliza Código Claude para el Desarrollo de IA en Juegos Mediante Evolución de Autojuego.

Resultados y Enfoque de la Competencia
Un desarrollador utilizó Claude Code como todo su equipo de desarrollo para la Game AI Cup, un concurso de programación competitiva donde los participantes escriben bots para un juego basado en física 2D. El bot generado por Claude obtuvo el 6º puesto entre 83 participantes a lo largo de tres rondas.
El enfoque se inspiró en el concepto de autoresearch de Karpathy, donde un agente LLM itera sobre el código durante la noche. El desarrollador construyó un pequeño marco llamado autoevolve que adapta esto para dominios de autojuego — en lugar de optimizar una sola métrica, las versiones compiten entre sí cara a cara.
El Bucle de Evolución
El flujo de trabajo siguió este bucle:
- Claude Code lee el bot actual
- Analiza por qué perdió partidos específicos
- Propone un cambio específico
- La nueva versión se evalúa frente a versiones anteriores
- Mantener o descartar la versión
- Repetir el proceso
El desarrollador ejecutó aproximadamente 130 iteraciones durante varias semanas a lo largo de tres rondas de competencia.
Hallazgos Clave del Experimento
Los cambios estructurales superaron los ajustes de parámetros: Cada avance importante implicó agregar nuevas capacidades como control predictivo de modelos, un rol de portero o planificación consciente de la energía. Docenas de ajustes de umbrales y pesos fueron planos o negativos. El progreso fue más rápido cuando se guiaba a Claude hacia "agregar un nuevo comportamiento" en lugar de "ajustar este número".
Los comportamientos emergentes eran legibles en el código: Después de que Claude corrigió una función de costo de energía, el optimizador comenzó a usar rebotes en las paredes para invertir la dirección — rebotar en las paredes proporciona un cambio de dirección gratuito sin gastar energía. Este comportamiento nunca fue programado explícitamente pero es completamente legible en el código, a diferencia de los enfoques de redes neuronales que crearían una caja negra.
Las correcciones de errores se acumulan en aislamiento: Mezclar correcciones de errores con cambios de estrategia introdujo ruido. Dos correcciones de precisión solas en una versión vencieron a todos los principales contendientes, pero las mismas correcciones combinadas con un cambio de estrategia en otra versión fueron planas.
El registro de cambios fue esencial: Cada versión incluía la propuesta de Claude, el resultado esperado, el resultado real y las lecciones aprendidas. Esto permitió al desarrollador decirle a Claude "este enfoque falló tres veces, deja de intentarlo" y evitar repetir experimentos fallidos.
Aplicaciones Más Amplias
El desarrollador descubrió la lista awesome-autoresearch que muestra patrones similares de "LLM itera sobre el código durante la noche" aplicados en otros lugares: el CEO de Shopify logró un 53% más rápido de renderizado de plantillas con 93 commits automatizados, alguien escaló kernels CUDA de 18 a 187 TFLOPS, y el Vesuvius Challenge lo utilizó para descifrar rollos antiguos.
Comenzando con Autoevolve
El marco autoevolve funciona como una habilidad de Claude Code. Instálalo con:
npx skills add MrTsepa/autoevolveLuego dile a Claude que configure un experimento de evolución. El marco maneja calificaciones, emparejamientos, seguimiento del frente de Pareto y visualización.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Generación de Leads y Automatización de CRM con OpenClaw

Construyendo un Sistema de Investigación Agéntico con Claude Code: Una Implementación Práctica
Un desarrollador detalla cómo construyeron seis agentes especializados usando Claude Code para crear un mapa vivo de más de 250 implementaciones reales de IA, con un patrón de orquestación de humano en el circuito.

Juego de curling basado en navegador creado con Claude Sonnet 4.5 por alguien que no es programador.
Un desarrollador sin experiencia en programación creó un juego de curling completamente jugable en el navegador utilizando Claude Sonnet 4.5. El juego incluye física, puntuación y un flujo de juego completo, con Claude manejando toda la generación de código, depuración y refinamiento basado en comentarios en inglés sencillo.

Puntos de referencia de decodificación especulativa en RTX 3090 con modelos Qwen para uso empresarial en HVAC
Un desarrollador probó la decodificación especulativa en una RTX 3090 utilizando modelos Qwen para un bot de Discord de un negocio de HVAC, logrando hasta 279.9 tokens/seg con una aceleración del 236% usando Qwen3-8B con un modelo borrador Qwen3-1.7B.