Transformer Language Model работает локально на стандартной Game Boy Color
Разработчик запустил настоящую языковую модель-трансформер на стандартном Game Boy Color (GBC) — без телефона, ПК, Wi-Fi или облачных вычислений. Весь процесс вывода выполняется локально на портативном устройстве.
Ключевые детали
- Модель: TinyStories-260K Андрея Карпати, преобразованная в веса INT8 с математикой фиксированной запятой — без поддержки чисел с плавающей запятой.
- Оборудование: Стандартный Game Boy Color + флеш-картридж EZ Flash Junior + microSD-карта.
- Инструментарий сборки: GBDK-2020, создающий ROM для Game Boy с маппером MBC5.
- Архитектура памяти: Веса модели хранятся в переключаемой банками ROM картриджа. KV-кэш размещается в SRAM картриджа, так как оперативная память GBC очень мала.
- Ввод запроса: На устройстве с помощью D-pad/кнопок и экранной клавиатуры.
- Конвейер вывода: Токенизация запроса на GBC, затем предварительное заполнение трансформера и автогенерация с KV-кэшированием.
- Производительность: Чрезвычайно медленно; вывод представляет собой бессвязный текст из-за сильного квантования и математических приближений, но основной цикл трансформера работает.
- Исходный код: Доступен на GitHub по адресу github.com/maddiedreese/gbc-transformer. Значительная часть кода была создана с помощью Codex AI.
Этот проект демонстрирует, что даже сильно ограниченное по ресурсам оборудование может выполнять вывод трансформера при агрессивном квантовании и уловках управления памятью. Это доказательство концепции, а не практическая LLM, но оно представляет собой технический курьез, достойный изучения.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Клод AI пострадал от массового сбоя: веб-интерфейс не работает, ошибки API участились
Claude.ai недоступен, а API возвращает повышенный уровень ошибок по состоянию на 28 апреля 2025 года, 19:15 UTC. Официальная страница статуса подтверждает текущий инцидент.

Опус 4.6: Расширенное мышление демонстрирует худшие результаты в задачах с физическими диаграммами.
Тестирование показывает, что Claude Opus 4.6 с расширенным мышлением последовательно не справляется с физическими задачами, требующими интерпретации визуальных диаграмм, в то время как Gemini 3.1 Pro успешно их решает. Отключение расширенного мышления позволяет Opus 4.6 правильно и быстрее решать те же задачи.

Исследование: ИИ «разбивает» рабочие места на более узкие и низкооплачиваемые задачи
Новая статья утверждает, что ИИ не уничтожает рабочие места напрямую, а «разбивает» их на более узкие задачи. В профессиях со слабой связностью задач это приводит к сокращению сферы деятельности и оплаты, тогда как в профессиях с сильной связностью могут наблюдаться улучшения производительности.

Рост экосистемы OpenClaw и ключевые участники на карте
Участник сообщества составил карту стремительного расширения экосистемы OpenClaw, отметив более 230 тысяч звёзд на GitHub, более 116 тысяч участников в Discord и появление компаний в сферах управляемого хостинга, маршрутизации LLM и слоёв безопасности в течение 60 дней с момента запуска.