Referência: Gemma4 12B vs Qwen3 8B quantizado em Mac Mini de 24GB

Comparação de desempenho de dois modelos locais para OpenClaw
Um desenvolvedor realizou um teste direto comparando o Gemma4 12B e o Qwen3:8b-q4_K_M em um Mac Mini de 24GB. O teste usou dois prompts: "explique como funciona um carburador" e "escreva uma função Python para detectar vazamentos de memória". O Claude ajudou a escrever um comando para filtrar a saída com grep para medição.
Resultados do benchmark
Tarefa de explicação do carburador:
- Qwen3:8b-q4_K_M: Avaliação do prompt: 89,8 t/s, Geração: 19,6 t/s
- Gemma4: Avaliação do prompt: 20,8 t/s, Geração: 27,6 t/s
Tarefa de codificação Python:
- Qwen3:8b-q4_K_M: Avaliação do prompt: 133,8 t/s, Geração: 18,7 t/s
- Gemma4: Avaliação do prompt: 26,1 t/s, Geração: 26,1 t/s
Principais conclusões
O Qwen3 processa prompts 4-5x mais rápido que o Gemma4, o que é importante para o OpenClaw devido aos prompts de contexto grandes normalmente enviados. O Gemma4 gera a saída um pouco mais rápido. Para muitos usos do OpenClaw, o Qwen3 vence em velocidade. O desenvolvedor observa que o Gemma4 é um modelo de 12B e pode produzir uma saída ligeiramente melhor, embora isso não tenha sido testado.
O desenvolvedor executa várias tarefas em modelos locais, incluindo trabalhos cron, monitoramento de heartbeat, indexação de memória, e frequentemente faz o OpenClaw chamar subagentes executando modelos locais. Eles estão testando o Gemma4 como o modelo local para todas essas tarefas em segundo plano, mas não esperam notar diferenças de desempenho, já que estas rodam em segundo plano.
📖 Read the full source: r/openclaw
👀 See Also

Mind Keg MCP: Memória Persistente para Claude Code e Agentes Compatíveis com MCP
Mind Keg MCP v0.1.1 é um servidor MCP de código aberto que fornece memória persistente para Claude Code e outros agentes compatíveis com MCP. Ele armazena aprendizados localmente via SQLite e os recupera através de busca semântica, permitindo que assistentes de codificação de IA lembrem o contexto entre sessões.

GoStaff: Reescrita em Go do OpenClaw com Redução de Memória de 100x
GoStaff é uma reescrita em Go do OpenClaw que usa aproximadamente 100x menos memória (~17MB) enquanto mantém a compatibilidade com plugins do OpenClaw através de um shim JavaScript. Ele apresenta um sistema de habilidades de três níveis, persistência unificada no Postgres e loops ReAct com múltiplos provedores.

Sylve: Um Plano de Gerenciamento FreeBSD para Virtualização, Contêineres e Armazenamento
Sylve é um plano de gerenciamento licenciado BSD-2 para FreeBSD que fornece controle unificado sobre máquinas virtuais Bhyve, FreeBSD Jails, armazenamento ZFS e rede. Ele usa um modelo de consenso RAFT para clustering e inclui gerenciamento de compartilhamentos Samba com automação de snapshots ZFS.

Plugin Claude Code para Pesquisa de Negócios no Reddit
Um plugin do Claude Code automatiza a pesquisa no Reddit para empresas, buscando postagens relevantes, analisando discussões e gerando relatórios estruturados em markdown com descobertas e links de origem. Sem necessidade de chaves de API — instale via GitHub e execute com um único comando.