Gemma 4 : 4 Tailles de Modèles pour l'IA Locale

Spécifications des modèles Gemma 4

Gemma 4 est désormais disponible en tant que modèle d'IA auto-hébergé avec quatre configurations distinctes pour différents scénarios matériels. Selon la source, il ne rivalise pas avec Claude, Codex ou Gemini, mais se positionne comme une option pratique pour les scénarios multi-routage où un petit modèle auto-hébergé performant peut économiser des tokens.

Variantes de modèles et exigences matérielles

E2B (2,3 milliards de paramètres effectifs) : Conçu pour les appareils périphériques comme les téléphones et les Raspberry Pi. Nécessite ~4-8 Go de RAM et fonctionne bien sur un CPU. Recommandé pour l'hébergement sur VPS.
E4B (4,5 milliards de paramètres effectifs) : Conçu pour les ordinateurs portables et le matériel bas de gamme. Conserve une empreinte mémoire faible.
26B MoE (25 milliards au total, 3,8 milliards actifs) : Conçu pour les GPU grand public. Fonctionne à des vitesses d'inférence similaires à un modèle de 4 milliards.
31B Dense : Conçu pour les GPU et stations de travail milieu de gamme. Nécessite environ 16-20 Go de VRAM lors de l'utilisation d'une quantification 4 bits.

Capacités et disponibilité

Tous les modèles Gemma 4 sont multimodaux avec des capacités texte et vision. Les modèles périphériques E2B et E4B prennent spécifiquement en charge l'audio en temps réel. Les modèles sont conçus pour un raisonnement avancé et des flux de travail agentiques.

Gemma 4 est disponible sur Google AI Studio, Hugging Face, Kaggle et Ollama.

📖 Read the full source: r/openclaw

Gemma 4 Sorti : Quatre Tailles de Modèles pour l'Hébergement d'IA en Local

Spécifications des modèles Gemma 4

Variantes de modèles et exigences matérielles

Capacités et disponibilité

👀 See Also

Claude Opus 4.7 régresse en raisonnement et en conversation, rapportent les utilisateurs

Mise à jour OpenClaw 2026.3.22 : Fonctionnalités utiles mais trois problèmes critiques nécessitent de la prudence

Bogue du modèle de chat Gemma 4 : paramètres d'outil avec anyOf/null rendus comme type vide

Conception d'une équipe d'agents : Comment Google Antigravity structure les sous-agents pour la génération autonome de code