ゲームボーイカラーで動作するTransformer言語モデル
Ad
開発者が、実際のトランスフォーマー言語モデルを通常のゲームボーイカラー(GBC)で動作させました。電話、PC、Wi-Fi、クラウド推論は一切使用していません。推論パイプライン全体がハンドヘルドハードウェア上でローカルに実行されます。
主な詳細
- モデル: Andrej Karpathy氏のTinyStories-260K。INT8重みに変換され、固定小数点演算を使用。浮動小数点のサポートは不要。
- ハードウェア: 通常のゲームボーイカラー + EZ Flash Juniorフラッシュカート + microSDカード。
- ビルドツールチェーン: GBDK-2020。MBC5ゲームボーイROMを生成。
- メモリアーキテクチャ: モデル重みはバンク切り替えカートリッジROMに格納。KVキャッシュはカートリッジSRAMに保存。GBCのワークRAMは非常に小さいため。
- プロンプト入力: Dパッド/ボタンとオンスクリーンキーボードを使用してデバイス上で入力。
- 推論パイプライン: GBC上でプロンプトのトークン化、トランスフォーマーのプリフィル、KVキャッシュを使った自己回帰生成。
- パフォーマンス: 非常に遅い。激しい量子化と数学的近似のため出力は無意味だが、コアのトランスフォーマーループは動作する。
- ソースコード: GitHubのgithub.com/maddiedreese/gbc-transformerで公開。コードの大部分はCodex AIを使って作成。
このプロジェクトは、極度にリソース制約のあるハードウェアでも、積極的な量子化とメモリ管理の工夫によりトランスフォーマー推論が実行可能であることを示しています。実用的なLLMではなく概念実証ですが、技術的興味をそそる価値があります。
📖 ソース全文: r/LocalLLaMA
Ad
👀 See Also

News
マイクロソフト幹部、AIエージェントに「シート機会」としてソフトウェアライセンスが必要になる可能性を示唆
マイクロソフトの幹部であるラジェシュ・ジャ氏は、AIエージェントが独自のソフトウェアライセンスを必要とする可能性があり、各エージェントが企業システムにおける「シート」としてカウントされると示唆しています。これは、AIが人間のユーザーを置き換えることでライセンス数を削減するという見解とは対照的です。
OpenClawRadar
🦀
News
Opus 4.7 推論努力ベンチマーク: 実タスクでは中が高と最大を上回る
GraphQL-go-toolsリポジトリの29タスクにおいて、Claude Code内のOpus 4.7は中程度の推論努力で最高のパフォーマンスを発揮しました。それ以上の設定では、パッチ品質を向上させることなく正解率が低下し、コストが増加しました。
OpenClawRadar

News
オープンクローの歴史:モルトボットからオープンソースAI革命へ
なし

News
開発者のObsidian AIエージェントプロジェクトが一夜にして話題沸騰
ある博士課程の研究者が、Obsidianボールトを管理するAIエージェントのチームを構築し、GitHubで共有したところ、13時間以内に700以上のスターを獲得しました。突然の注目によりパニックに陥り、一時的にリポジトリを非公開にした後、改善を加えて再公開しました。
OpenClawRadar