Gemma 4リリース：4モデルサイズでローカルAIホスティング

Gemma 4 モデル仕様

Gemma 4は、さまざまなハードウェアシナリオ向けに4つの異なる構成を持つセルフホスト型AIモデルとして利用可能になりました。ソースによると、Claude、Codex、Geminiとは競合せず、小規模で高性能なセルフホストモデルがトークンを節約できるマルチルーティングシナリオにおける実用的な選択肢として位置付けられています。

モデルバリアントとハードウェア要件

E2B（実効パラメータ23億）: スマートフォンやRaspberry Piなどのエッジデバイス向けに構築。約4〜8GBのRAMを必要とし、CPU上で良好に動作。VPSでのホスティングに推奨。
E4B（実効パラメータ45億）: ノートパソコンやローエンドハードウェア向けに構築。メモリ使用量を低く維持。
26B MoE（総パラメータ250億、アクティブ38億）: コンシューマー向けGPU向けに構築。40億パラメータモデルと同様の推論速度で動作。
31B Dense: ミッドレンジGPUやワークステーション向けに構築。4ビット量子化使用時には約16〜20GBのVRAMを必要とします。