ジェンマ4リリース:ローカルAIホスティング向け4つのモデルサイズ

Gemma 4 モデル仕様
Gemma 4は、さまざまなハードウェアシナリオ向けに4つの異なる構成を持つセルフホスト型AIモデルとして利用可能になりました。ソースによると、Claude、Codex、Geminiとは競合せず、小規模で高性能なセルフホストモデルがトークンを節約できるマルチルーティングシナリオにおける実用的な選択肢として位置付けられています。
モデルバリアントとハードウェア要件
- E2B(実効パラメータ23億): スマートフォンやRaspberry Piなどのエッジデバイス向けに構築。約4〜8GBのRAMを必要とし、CPU上で良好に動作。VPSでのホスティングに推奨。
- E4B(実効パラメータ45億): ノートパソコンやローエンドハードウェア向けに構築。メモリ使用量を低く維持。
- 26B MoE(総パラメータ250億、アクティブ38億): コンシューマー向けGPU向けに構築。40億パラメータモデルと同様の推論速度で動作。
- 31B Dense: ミッドレンジGPUやワークステーション向けに構築。4ビット量子化使用時には約16〜20GBのVRAMを必要とします。
機能と利用可能性
すべてのGemma 4モデルは、テキストと画像の両方の機能を備えたマルチモーダルです。特にE2BとE4Bのエッジモデルはリアルタイム音声をサポートしています。これらのモデルは高度な推論とエージェントワークフロー向けに構築されています。
Gemma 4は、Google AI Studio、Hugging Face、Kaggle、Ollamaで利用可能です。
📖 Read the full source: r/openclaw
👀 See Also

Amazonのコネクトタレント:AIエージェントが大量採用面接を自動化
AmazonがConnect Talentを発表。大規模採用向けにAIエージェントが自動で面接を実施する。このソフトウェアは人間の介入なしにスクリーニング、面接、メモ作成を処理し、自律型AIエージェントへの広範な取り組みの一環。

シンプルな自己蒸留法がLLMのコード生成を改善
研究者らは、大規模言語モデル(LLM)を自身のサンプリング出力でファインチューニングする(シンプルな自己蒸留)ことで、コード生成性能が向上することを示した。Qwen3-30B-Instructでは、LiveCodeBench v6におけるpass@1が42.4%から55.3%に向上した。

Claude Code Opus 4.6は、デフォルトで100万トークンのコンテキストウィンドウを採用
Claude CodeのOpus 4.6モデルは、デフォルトで100万トークンのコンテキストウィンドウを備えるようになりましたが、以前のバージョンと同じ価格設定を維持しています。この変更は公式発表なしに実施されているようです。

ミニマックスは本当に時代遅れなのか?現在の議論を探る
AIと技術自動化の世界において、Redditでの議論がミニマックスアルゴリズムの関連性に疑問を投げかけています。それは本当に時代遅れなのでしょうか、それとも現代のAIアプリケーションにおいて依然として価値を保持しているのでしょうか?