Modelo de lenguaje Transformer ejecutándose localmente en un Game Boy Color estándar
Un desarrollador ha logrado que un modelo de lenguaje transformador real funcione en un Game Boy Color (GBC) estándar, sin necesidad de teléfono, PC, Wi-Fi ni inferencia en la nube. Todo el proceso de inferencia se ejecuta localmente en el hardware portátil.
Detalles clave
- Modelo: TinyStories-260K de Andrej Karpathy, convertido a pesos INT8 con matemáticas de punto fijo, sin necesidad de soporte de coma flotante.
- Hardware: Game Boy Color estándar + EZ Flash Junior (cartucho flash) + tarjeta microSD.
- Cadena de herramientas: GBDK-2020, que produce un ROM MBC5 para Game Boy.
- Arquitectura de memoria: Los pesos del modelo residen en la ROM del cartucho con bancos. La caché KV se almacena en la SRAM del cartucho debido a que la RAM de trabajo del GBC es muy pequeña.
- Ingreso de texto: En el propio dispositivo, usando el D-pad y botones con un teclado en pantalla.
- Proceso de inferencia: Tokenización del texto en el GBC, luego precarga del transformador y generación autorregresiva con almacenamiento en caché KV.
- Rendimiento: Extremadamente lento; la salida es ininteligible debido a la fuerte cuantización y aproximaciones matemáticas, pero el bucle principal del transformador funciona.
- Código fuente: Disponible en GitHub en github.com/maddiedreese/gbc-transformer. Una gran parte del código fue creado usando Codex AI.
El proyecto demuestra que incluso hardware con recursos extremadamente limitados puede ejecutar inferencia de transformadores con técnicas agresivas de cuantización y gestión de memoria. Es una prueba de concepto, no un LLM práctico, pero es una curiosidad técnica que vale la pena examinar.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

OpenClaw 2026.4.29 roto – Degradar a 2026.2.6
OpenClaw versión 2026.4.29 está rota con errores aleatorios, CLI lenta, respuestas duplicadas. Vuelve a la versión 2026.2.6 para solucionarlo.

Investigación: La IA está 'desagregando' empleos en tareas más específicas y peor remuneradas.
Un nuevo artículo argumenta que la IA no está eliminando empleos directamente, sino 'desagregándolos' en tareas más específicas, con ocupaciones de paquetes débiles viendo reducido su alcance y salario, mientras que los trabajos de paquetes fuertes pueden experimentar mejoras en el rendimiento.

Diferencias entre usar Claude a través de GitHub Copilot y como una extensión de VS Code.
Explora las diferencias entre usar Claude AI a través de las sesiones objetivo de GitHub Copilot y como una extensión de VS Code, basándote en su integración y funcionalidad.

Desarrollador de OpenClaw Informa Problemas de Compactación de Contexto Durante la Construcción de Driftwatch V3
Un desarrollador de OpenClaw completó los sprints 2-4 de la construcción de Driftwatch V3, pero encontró problemas de compactación de contexto que borraron la memoria del agente de IA a mitad de la sesión, requiriendo intervención manual para restaurar el progreso utilizando resúmenes de sprint.