Gemma 4 Sorti : Quatre Tailles de Modèles pour l'Hébergement d'IA en Local

Spécifications des modèles Gemma 4
Gemma 4 est désormais disponible en tant que modèle d'IA auto-hébergé avec quatre configurations distinctes pour différents scénarios matériels. Selon la source, il ne rivalise pas avec Claude, Codex ou Gemini, mais se positionne comme une option pratique pour les scénarios multi-routage où un petit modèle auto-hébergé performant peut économiser des tokens.
Variantes de modèles et exigences matérielles
- E2B (2,3 milliards de paramètres effectifs) : Conçu pour les appareils périphériques comme les téléphones et les Raspberry Pi. Nécessite ~4-8 Go de RAM et fonctionne bien sur un CPU. Recommandé pour l'hébergement sur VPS.
- E4B (4,5 milliards de paramètres effectifs) : Conçu pour les ordinateurs portables et le matériel bas de gamme. Conserve une empreinte mémoire faible.
- 26B MoE (25 milliards au total, 3,8 milliards actifs) : Conçu pour les GPU grand public. Fonctionne à des vitesses d'inférence similaires à un modèle de 4 milliards.
- 31B Dense : Conçu pour les GPU et stations de travail milieu de gamme. Nécessite environ 16-20 Go de VRAM lors de l'utilisation d'une quantification 4 bits.
Capacités et disponibilité
Tous les modèles Gemma 4 sont multimodaux avec des capacités texte et vision. Les modèles périphériques E2B et E4B prennent spécifiquement en charge l'audio en temps réel. Les modèles sont conçus pour un raisonnement avancé et des flux de travail agentiques.
Gemma 4 est disponible sur Google AI Studio, Hugging Face, Kaggle et Ollama.
📖 Read the full source: r/openclaw
👀 See Also

Un développeur de FFmpeg accuse OxideAV de blanchiment de licence IA dans le problème MagicYUV
Un développeur de FFmpeg a ouvert un ticket sur le dépôt magicyuv d'OxideAV, remettant en question sa licence et accusant un blanchiment de licence assisté par IA de code GPL.

Gemma 4 contre Qwen 3.5 : Résultats de l'évaluation à l'aveugle avec Claude Opus comme juge
Une évaluation à l'aveugle de 30 questions a comparé Gemma 4 31B, Gemma 4 26B-A4B et Qwen 3.5 27B en utilisant Claude Opus 4.6 comme juge. Qwen 3.5 27B a remporté 46,7 % des confrontations mais a obtenu des scores moyens inférieurs en raison de trois réponses notées zéro.

Claude-Code v2.1.84 ajoute l'outil PowerShell, les variables d'environnement et de multiples corrections
Claude-Code v2.1.84 introduit un outil PowerShell pour Windows en version préliminaire facultative, ajoute des variables d'environnement pour la configuration des modèles et les délais d'attente du streaming, et inclut de nombreuses corrections de bugs et améliorations de performances.

Analyse de Claude sur le débat Minimax et l'écart de marché d'Anthropic
Claude soutient que MiniMax a légalement obtenu des données d'entraînement en payant des millions d'appels API et identifie un manque dans la gamme de produits d'Anthropic pour un orchestrateur persistant et bon marché.