Modelo de Linguagem Transformer Executado Localmente em Game Boy Color Padrão

✍️ OpenClawRadar📅 Publicado: May 13, 2026🔗 Source
Ad

Um desenvolvedor conseguiu rodar um modelo de linguagem transformer real em um Game Boy Color (GBC) original — sem telefone, PC, Wi-Fi ou inferência em nuvem. Todo o pipeline de inferência é executado localmente no hardware portátil.

Ad

Detalhes Principais

  • Modelo: TinyStories-260K de Andrej Karpathy, convertido para pesos INT8 com matemática de ponto fixo — sem necessidade de suporte a ponto flutuante.
  • Hardware: Game Boy Color original + flash cart EZ Flash Junior + cartão microSD.
  • Toolchain de construção: GBDK-2020, produzindo um ROM MBC5 Game Boy.
  • Arquitetura de memória: Os pesos do modelo ficam na ROM do cartucho com comutação de bancos. O cache KV é armazenado na SRAM do cartucho porque a RAM de trabalho do GBC é minúscula.
  • Entrada de prompt: No próprio dispositivo usando D-pad/botões e um teclado na tela.
  • Pipeline de inferência: Tokenização do prompt no GBC, depois preenchimento do transformer + geração autoregressiva com cache KV.
  • Desempenho: Extremamente lento; a saída é sem sentido devido à quantização pesada e aproximações matemáticas, mas o loop principal do transformer funciona.
  • Código-fonte: Disponível no GitHub em github.com/maddiedreese/gbc-transformer. Grande parte do código foi construída usando Codex AI.

O projeto demonstra que mesmo hardware severamente limitado em recursos pode executar inferência de transformer com quantização agressiva e truques de gerenciamento de memória. É uma prova de conceito, não um LLM prático, mas é uma curiosidade técnica que vale a pena examinar.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

O Claude da Anthropic Realiza 80 Mil Entrevistas Estruturadas como Alternativa a Pesquisas
News

O Claude da Anthropic Realiza 80 Mil Entrevistas Estruturadas como Alternativa a Pesquisas

A Anthropic usou o Claude para conduzir entrevistas estruturadas com aproximadamente 80.000 usuários em mais de 150 países e 70+ idiomas, com o LLM atuando tanto como entrevistador quanto analista para coletar insights conversacionais.

OpenClawRadar
Clanker T1000 de Greg Kroah-Hartman: LLM local no Framework Desktop com AMD Ryzen AI Max investigando bugs do kernel Linux
News

Clanker T1000 de Greg Kroah-Hartman: LLM local no Framework Desktop com AMD Ryzen AI Max investigando bugs do kernel Linux

O 'gregkh_clanker_t1000' de Greg KH usa um LLM local rodando em um Framework Desktop (AMD Ryzen AI Max+) para fazer fuzzing no kernel Linux, resultando em ~20 patches mesclados desde 7 de abril corrigindo bugs em ALSA, HID, SMB, Nouveau, IO_uring e mais.

OpenClawRadar
Implantação Simplificada: Nova Configuração AWS com Um Clique para Open Claw Lançada
News

Implantação Simplificada: Nova Configuração AWS com Um Clique para Open Claw Lançada

Os entusiastas do Open Claw agora têm um motivo para comemorar. Uma nova ferramenta de implantação em um clique na AWS simplifica o processo de configuração do Open Claw, tornando-o mais acessível para desenvolvedores e entusiastas.

OpenClawRadar
A pesquisa de rastreamento de circuitos da Anthropic revela os mecanismos internos do Claude 3.5 Haiku
News

A pesquisa de rastreamento de circuitos da Anthropic revela os mecanismos internos do Claude 3.5 Haiku

A Anthropic publicou uma pesquisa de rastreamento de circuitos em uma versão simplificada do Claude 3.5 Haiku, revelando seis comportamentos específicos, incluindo seu estado padrão "não sei", escrita de poemas de trás para frente e processamento matemático de duplo caminho.

OpenClawRadar