Gemma 4 E2B Testado como Coordenador Multi-Agente em Framework TypeScript

✍️ OpenClawRadar📅 Publicado: April 14, 2026🔗 Source
Gemma 4 E2B Testado como Coordenador Multi-Agente em Framework TypeScript
Ad

Capacidades do Coordenador Testadas

O teste avaliou se o Gemma 4 E2B poderia lidar com o papel de coordenador em um sistema multiagente, especificamente: receber um objetivo em linguagem natural, dividi-lo em um gráfico de tarefas, atribuir agentes, chamar ferramentas e juntar os resultados.

Implementação Técnica

O framework usado foi open-multi-agent (TypeScript, código aberto) com Ollama via uma API compatível com OpenAI. O coordenador recebe um objetivo e uma lista de agentes, então gera um array de tarefas JSON com título, descrição, responsável e dependências. Os agentes executam com capacidades de chamada de ferramentas incluindo bash e operações de leitura/escrita de arquivos.

Detalhes do Modelo

O Gemma 4 E2B ("Effective 2B") tem 2,3 bilhões de parâmetros efetivos e 5,1 bilhões de parâmetros totais. Os ~2,8 bilhões de parâmetros extras são para a camada de embedding que suporta mais de 140 idiomas e capacidades multimodais.

Cenário do Teste

O objetivo fornecido foi: "Verifique a versão do Node.js desta máquina, a versão do npm e as informações do SO, então escreva um breve relatório em Markdown em /tmp/report.md"

O E2B fez corretamente:

  • Dividiu em 2 tarefas com uma dependência (pesquisador → resumidor)
  • Atribuiu cada uma ao agente correto
  • Usou bash para executar comandos do sistema
  • Usou file_write para salvar o relatório
  • Sintetizou a saída final

Tanto runTasks() (pipeline explícito) quanto runTeam() (o modelo planeja tudo autonomamente) funcionaram.

Ad

Desempenho e Observações

Em um M1 com 16GB de RAM:

  • O runTeam() completo leva ~2 minutos
  • 6–9 chamadas sequenciais de LLM nos bastidores (planejamento do coordenador → uso multi-turn de ferramentas do pesquisador → resumidor → síntese do coordenador)
  • ~10–15 segundos por chamada no M1
  • O E2B usa ~3–4 GB de RAM sem pressão de memória

O que funcionou bem:

  • Saída JSON: O coordenador produziu o esquema correto para decomposição de tarefas. O framework tem análise tolerante que tenta blocos delimitados primeiro, depois recorre à extração de array simples.
  • Chamada de ferramentas: Funciona através do endpoint compatível com OpenAI, decidindo corretamente quando chamar, analisando argumentos e lidando com resultados multi-turn.

Limitações observadas:

  • Qualidade da saída: A prosa na síntese final é notavelmente mais fraca do que em modelos maiores. Funcional, mas não polida.

Passos para Reprodução

ollama pull gemma4:e2b
git clone https://github.com/JackChen-me/open-multi-agent
cd open-multi-agent && npm install
no_proxy=localhost npx tsx examples/08-gemma4-local.ts

O arquivo de teste tem ~190 linhas em examples/08-gemma4-local.ts. A configuração no_proxy=localhost só é necessária se você tiver um proxy HTTP configurado.

📖 Leia a fonte completa: r/LocalLLaMA

Ad

👀 See Also

Watchtower: Um Proxy Local para Monitorar o Tráfego da API de Código Claude
Tools

Watchtower: Um Proxy Local para Monitorar o Tráfego da API de Código Claude

Watchtower é uma ferramenta gratuita e de código aberto que atua como um proxy HTTP local e painel web em tempo real para interceptar e exibir todo o tráfego de API entre o Claude Code (ou Codex CLI) e suas APIs. Ele mostra requisições, fluxos SSE, definições de ferramentas, prompts do sistema, uso de tokens e limites de taxa.

OpenClawRadar
OpenClaw PARA Habilidade Organizacional Classifica Automaticamente Arquivos em Projetos, Áreas, Recursos, Arquivos
Tools

OpenClaw PARA Habilidade Organizacional Classifica Automaticamente Arquivos em Projetos, Áreas, Recursos, Arquivos

Um desenvolvedor criou uma habilidade OpenClaw que aplica o método PARA (Projetos, Áreas, Recursos, Arquivos) para organizar arquivos, classificando automaticamente o conteúdo em vez de despejar tudo no diretório raiz.

OpenClawRadar
Desenvolvedor compartilha solução para Claude AI ignorar regras além do limite de 50 contagens
Tools

Desenvolvedor compartilha solução para Claude AI ignorar regras além do limite de 50 contagens

Um desenvolvedor relata que o Claude Code começou a ignorar regras silenciosamente quando seu conjunto de regras compartilhado ultrapassou aproximadamente 50 itens, especialmente durante tarefas intensivas no frontend. Eles criaram um hook que analisa os prompts e carrega apenas 2-3 regras relevantes com base na correspondência de palavras-chave.

OpenClawRadar
MephisQuiz: Plataforma Gratuita de Quiz Baseada em Cenários para Avaliação de Funções de Engenharia
Tools

MephisQuiz: Plataforma Gratuita de Quiz Baseada em Cenários para Avaliação de Funções de Engenharia

Um profissional de SRE criou o MephisQuiz, uma plataforma gratuita de quiz com mais de 860 perguntas baseadas em cenários, abrangendo 4 trilhas de funções de engenharia. A plataforma utiliza dificuldade adaptativa, fornece análises detalhadas por tópico e foi desenvolvida usando o Claude AI como programador par.

OpenClawRadar