LLM Local Batalla con el Solitario de Unreal Engine: Qwen 3.6-27B Quema 687k Tokens en una Carta

El experimento de un usuario de Reddit con LLMs locales para desarrollo de juegos revela severas limitaciones prácticas. Usando Qwen 3.6-27B con acceso a unreal-mcpython, SearXNG y GitHub, la tarea era crear un juego de Solitario en Unreal Engine. Después de unas horas (mucho tiempo esperando respuestas del usuario a las indicaciones), el resultado fue una sola carta con texturas correctas pero sin lógica de juego, consumiendo ↑687k y ↓210k tokens.
Intervenciones manuales requeridas
- Descargar PNGs con las caras de las cartas manualmente
- Crear una malla con 3 materiales (el cubo estándar solo tiene un material lateral)
- Indicaciones constantes como "deja de imaginar cosas, usa una búsqueda"
- Correcciones repetidas: "la carta no tiene textura" o "la carta tiene as de picas en ambos lados"
El problema de la carta de dos caras consumió la mayor parte del tiempo y los tokens. El cubo estándar solo puede tener un material en todos los lados; se requiere una malla personalizada con 3 materiales. Gemini Flash 3.5 generó el archivo OBJ correcto en un intento, pero Qwen dio vueltas durante horas a pesar de encontrar ejemplos de código concretos. El modelo insistía en crear planos, combinar dos planos con un cubo, deshabilitar sustrato u otros enfoques que no funcionaban. El usuario finalmente tuvo que proporcionar la malla manualmente.
Gemma 4-31B fue probada pero no pudo hacer una llamada MCP significativa y fue descalificada pronto.
Conclusión práctica: para tareas de Unreal Engine que implican geometría personalizada, los LLMs locales como Qwen 3.6-27B todavía requieren una supervisión considerable. Los presupuestos de tokens se disparan rápidamente, y las operaciones básicas de malla siguen siendo un obstáculo.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

NVIDIA lanza la CPU Vera para cargas de trabajo de IA agentica
NVIDIA ha lanzado la CPU Vera, un procesador diseñado específicamente para cargas de trabajo de IA agentica y aprendizaje por refuerzo, afirmando un rendimiento 50% más rápido y el doble de eficiencia en comparación con las CPU tradicionales a escala de rack.

Claude MAX Plan Ahora Incluye Ventana de Contexto de 1 Millón de Tokens Sin Costo Adicional
El plan Claude MAX se ha actualizado automáticamente para incluir una ventana de contexto de 1 millón de tokens sin cargos adicionales por uso de API, y los usuarios informan una reducción significativa en el uso de tokens y la eliminación de la sobrecarga de gestión de la ventana de contexto.

Anthropic aumenta los límites de Claude y añade capacidad de cómputo de SpaceX
Anthropic ha aumentado los límites de uso de Claude y ha cerrado un acuerdo de cómputo con SpaceX. El debate en Reddit evalúa si esto es solo escalado de infraestructura o un movimiento estratégico para convertir a Claude en una mejor plataforma para el trabajo agentivo.

Tres Brechas Críticas en OpenClaw para Agentes de IA de Producción
Un desarrollador identifica tres capacidades faltantes en OpenClaw que impiden que los agentes de IA funcionen como verdaderos empleados: auditabilidad, control granular de acciones y resolución de instrucciones.