Referência: Gemma4 12B vs Qwen3 8B quantizado em Mac Mini de 24GB

✍️ OpenClawRadar📅 Publicado: April 21, 2026🔗 Source

Comparação de desempenho de dois modelos locais para OpenClaw

Um desenvolvedor realizou um teste direto comparando o Gemma4 12B e o Qwen3:8b-q4_K_M em um Mac Mini de 24GB. O teste usou dois prompts: "explique como funciona um carburador" e "escreva uma função Python para detectar vazamentos de memória". O Claude ajudou a escrever um comando para filtrar a saída com grep para medição.

Resultados do benchmark

Tarefa de explicação do carburador:

Qwen3:8b-q4_K_M: Avaliação do prompt: 89,8 t/s, Geração: 19,6 t/s
Gemma4: Avaliação do prompt: 20,8 t/s, Geração: 27,6 t/s

Tarefa de codificação Python:

Qwen3:8b-q4_K_M: Avaliação do prompt: 133,8 t/s, Geração: 18,7 t/s
Gemma4: Avaliação do prompt: 26,1 t/s, Geração: 26,1 t/s

Principais conclusões

O Qwen3 processa prompts 4-5x mais rápido que o Gemma4, o que é importante para o OpenClaw devido aos prompts de contexto grandes normalmente enviados. O Gemma4 gera a saída um pouco mais rápido. Para muitos usos do OpenClaw, o Qwen3 vence em velocidade. O desenvolvedor observa que o Gemma4 é um modelo de 12B e pode produzir uma saída ligeiramente melhor, embora isso não tenha sido testado.

O desenvolvedor executa várias tarefas em modelos locais, incluindo trabalhos cron, monitoramento de heartbeat, indexação de memória, e frequentemente faz o OpenClaw chamar subagentes executando modelos locais. Eles estão testando o Gemma4 como o modelo local para todas essas tarefas em segundo plano, mas não esperam notar diferenças de desempenho, já que estas rodam em segundo plano.

📖 Read the full source: r/openclaw

👀 See Also

Tools

Ferramenta de Vigilância de Código Aberto Aborda Problema de Identidade de Agente no Ecossistema OpenClaw

Um usuário do OpenClaw que estava construindo um serviço web descobriu tráfego de agentes indistinguível de usuários humanos, o que levou ao desenvolvimento do Vigil - uma camada de identidade de código aberto baseada no W3C DID que fornece credenciais criptográficas e histórico comportamental para agentes.

Mar 10, 2026, 11:45 AM UTC

OpenClawRadar

Tools

OpenHelm: Um Aplicativo macOS para Automatizar Tarefas de Código do Claude

OpenHelm é um aplicativo gratuito e local para macOS que automatiza tarefas repetitivas de codificação com o Claude, executando trabalhos em um cronograma, repetindo automaticamente falhas e dividindo o trabalho em partes para evitar limites de sessão. Ele usa sua assinatura existente do Claude para chamadas de LLM.

Apr 7, 2026, 12:45 AM UTC

OpenClawRadar

Tools

MCP-Índia-Stack: Servidor offline-first para dados financeiros indianos em agentes de IA

MCP-India-Stack é um servidor MCP offline-first que fornece funcionalidades de API financeira e governamental indiana sem autenticação ou chamadas de API externas. Ele agrupa conjuntos de dados localmente para cálculos fiscais, ferramentas de validação e consultas.

Apr 14, 2026, 09:59 AM UTC

OpenClawRadar

Tools

Modo Cowork do Claude explicado: execução de tarefas em nível de arquivo versus modos de bate-papo e código

O modo Cowork do Claude opera dentro de uma pasta escolhida para realizar tarefas em nível de arquivo, como organizar pastas bagunçadas, extrair dados estruturados de capturas de tela e combinar notas dispersas em documentos estruturados.

Mar 8, 2026, 09:45 PM UTC

OpenClawRadar