Gemma 4 Lançado: Quatro Tamanhos de Modelo para Hospedagem Local de IA

✍️ OpenClawRadar📅 Publicado: April 6, 2026🔗 Source
Gemma 4 Lançado: Quatro Tamanhos de Modelo para Hospedagem Local de IA
Ad

Especificações do Modelo Gemma 4

O Gemma 4 agora está disponível como um modelo de IA auto-hospedado com quatro configurações distintas para diferentes cenários de hardware. De acordo com a fonte, ele não compete com Claude, Codex ou Gemini, mas é posicionado como uma opção prática para cenários de roteamento múltiplo onde um modelo auto-hospedado pequeno e capaz pode economizar tokens.

Variantes do Modelo e Requisitos de Hardware

  • E2B (2,3 bilhões de parâmetros efetivos): Construído para dispositivos de borda como telefones e Raspberry Pi. Requer ~4-8GB de RAM e roda bem em uma CPU. Recomendado para hospedagem em VPS.
  • E4B (4,5 bilhões de parâmetros efetivos): Construído para laptops e hardware de baixo custo. Mantém uma pegada de memória baixa.
  • 26B MoE (25B total, 3,8B ativos): Construído para GPUs de consumo. Opera em velocidades de inferência semelhantes a um modelo de 4B.
  • 31B Denso: Construído para GPUs de médio porte e estações de trabalho. Requer aproximadamente 16-20GB de VRAM ao usar quantização de 4 bits.
Ad

Capacidades e Disponibilidade

Todos os modelos Gemma 4 são multimodais com capacidades de texto e visão. Os modelos de borda E2B e E4B especificamente suportam áudio em tempo real. Os modelos são construídos para raciocínio avançado e fluxos de trabalho agentivos.

O Gemma 4 está disponível no Google AI Studio, Hugging Face, Kaggle e Ollama.

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Análise: Comparando a Indústria de IA aos Padrões da Crise Hipotecária Subprime
News

Análise: Comparando a Indústria de IA aos Padrões da Crise Hipotecária Subprime

A análise de Edward Zitron traça paralelos entre a crise de hipotecas subprime de 2008 e as tendências atuais da indústria de IA, citando dados específicos sobre hipotecas de taxa ajustável e suas semelhanças com os padrões de investimento em IA.

OpenClawRadar
Claude Code 2.1.76 adiciona elicitação MCP, melhorias em worktree e correções para limites de contexto
News

Claude Code 2.1.76 adiciona elicitação MCP, melhorias em worktree e correções para limites de contexto

A versão 2.1.76 do Claude Code introduz suporte à elicitação MCP para entrada estruturada durante tarefas, adiciona worktree.sparsePaths para grandes monorepositórios e corrige erros de 'Limite de contexto atingido' em sessões de 1 milhão de contexto. A versão 2.1.75 tornou as janelas de contexto de 1 milhão padrão para o Opus 4.6 nos planos Max, Team e Enterprise.

OpenClawRadar
A Anthropic lança o programa Embaixadores da Comunidade Claude
News

A Anthropic lança o programa Embaixadores da Comunidade Claude

A Anthropic lançou o programa Claude Community Ambassadors, que fornece recursos para organizar encontros locais de desenvolvedores e conectar construtores em todo o mundo. O programa está aberto a participantes de qualquer formação e localização.

OpenClawRadar
Experiência do desenvolvedor com a Claude AI: De parceiro de reflexão à terceirização cognitiva
News

Experiência do desenvolvedor com a Claude AI: De parceiro de reflexão à terceirização cognitiva

Um desenvolvedor compartilha uma experiência de 8 meses usando o Claude AI diariamente, observando uma mudança de usá-lo para refinar pensamentos existentes para terceirizar completamente o pensamento inicial. O post descreve duas abordagens cognitivas distintas: IA como parceira de pensamento versus IA como geradora de primeira passagem.

OpenClawRadar