O Qwen3.5 35B-A3B MoE executa um fluxo de trabalho agente de 27 etapas localmente em hardware de médio porte.

✍️ OpenClawRadar📅 Publicado: March 25, 2026🔗 Source
O Qwen3.5 35B-A3B MoE executa um fluxo de trabalho agente de 27 etapas localmente em hardware de médio porte.
Ad

Demonstração de fluxo de trabalho agêntico local

Um desenvolvedor no r/LocalLLaMA relatou executar com sucesso um fluxo de trabalho agêntico complexo localmente usando o Qwen3.5 35B-A3B MoE. O modelo executou uma cadeia de processamento de vídeo de 27 etapas de forma autônoma em hardware de médio porte.

Detalhes do fluxo de trabalho

A tarefa envolveu processar um vídeo a partir de um único prompt em linguagem natural:

  • Carregar um vídeo
  • Transcrever com Whisper
  • Editar as legendas
  • Inserir legendas de volta no vídeo com estilo personalizado

O fluxo de trabalho consistiu em 27 chamadas de ferramentas sequenciais incluindo: extract_audio, transcribe, read_file, edit_file, burn_subtitles, além de etapas de verificação. O modelo planejou, executou, verificou cada etapa e se autocorrigiu quando necessário.

Ad

Especificações técnicas

Hardware:

  • Estação de trabalho móvel Lenovo ThinkPad P53
  • Processador Intel i7-9850H
  • Quadro RTX 3000 (6GB VRAM)
  • 48GB DDR4 2666MT/s RAM

Pilha de software:

  • Implementação totalmente local com llama.cpp + whisper.cpp
  • Nenhuma API de nuvem utilizada

Configuração do modelo:

  • Qwen3.5 35B-A3B MoE com quantização Q4_K_M
  • Arquitetura MoE com ~3B parâmetros ativos por token
  • Cabe e executa em 6GB VRAM com camadas descarregadas
  • Base de conhecimento completa de 35B parâmetros

Resultados de desempenho

O fluxo de trabalho completo foi executado em aproximadamente 10 minutos, com a maior parte do tempo gasto em inferência. O desenvolvedor observou zero erros e zero intervenção humana necessária durante a cadeia de 27 etapas. A arquitetura MoE tornou isso viável em hardware de médio porte mantendo a contagem de parâmetros ativos baixa, enquanto preservava toda a capacidade do modelo.

Isso demonstra que fluxos de trabalho agênticos locais estão se tornando práticos em hardware de nível consumidor, particularmente com modelos MoE que equilibram a contagem de parâmetros ativos para velocidade contra a contagem total de parâmetros para capacidade.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Fluxo de Trabalho do Usuário: Usar Claude.ai para Planejamento e Claude Code para Implementação
Use Cases

Fluxo de Trabalho do Usuário: Usar Claude.ai para Planejamento e Claude Code para Implementação

Um desenvolvedor descreve o uso do Claude.ai para planejamento detalhado e discussões de arquitetura, depois o Claude Code para implementação, mas observa que não há estado compartilhado entre as duas ferramentas, exigindo transferências manuais de arquivos.

OpenClawRadar
SkiTomorrow.ai: Um Motor de Decisão para Viagens de Esqui Desenvolvido com Claude Code
Use Cases

SkiTomorrow.ai: Um Motor de Decisão para Viagens de Esqui Desenvolvido com Claude Code

SkiTomorrow.ai é uma ferramenta web gratuita que avalia 234 estações de esqui em todo o mundo com base em previsões de neve em tempo real, distância de viagem e custo, fornecendo classificações personalizadas. O desenvolvedor criou-a inteiramente usando Claude Code e compartilhou insights específicos sobre o fluxo de trabalho.

OpenClawRadar
Configuração do OpenClaw para atualizações de placar de beisebol universitário com alertas no Telegram
Use Cases

Configuração do OpenClaw para atualizações de placar de beisebol universitário com alertas no Telegram

Um desenvolvedor criou um fluxo OpenClaw que verifica os jogos de beisebol da ASU e GT a cada ~8 minutos usando a API do placar de beisebol universitário da ESPN, enviando alertas no Telegram apenas quando os placares, innings ou resultados finais mudam para evitar spam.

OpenClawRadar
Como a Arquitetura de Contexto Centralizada com Claude Economiza 10+ Horas Semanais
Use Cases

Como a Arquitetura de Contexto Centralizada com Claude Economiza 10+ Horas Semanais

Um usuário do Reddit relata economizar mais de 10 horas semanais ao transferir SOPs, atas de reuniões e CRM para um espaço de trabalho centralizado no Notion e conectar o Claude diretamente a esse contexto. Três fluxos de trabalho específicos eliminam a redação manual de e-mails, a entrada de dados em planilhas e a criação de conteúdo.

OpenClawRadar