Qwen3.6-27B cabe em uma única GPU de 24 GB e supera o anterior 397B MoE no SWE-bench

✍️ OpenClawRadar📅 Publicado: April 29, 2026🔗 Source

O Qwen3.6-27B foi lançado em 22 de abril, trazendo um modelo denso de 27B que cabe em uma única GPU de 24GB em Q4_K_M (~16,8GB) e atinge 77,2 no SWE-bench Verified — superando o modelo anterior de 397B MoE (76,2). Para desenvolvedores que executam agentes de codificação local em hardware de consumo, isso muda o patamar para modelos agentivos capazes.

Principais especificações e arquitetura

Contexto de 262K
Licença Apache 2.0
Atenção linear Gated DeltaNet (3 de 4 subcamadas) com Gated Attention para o restante
"Preservation de Pensamento" carrega vestígios de raciocínio entre turnos, reduzindo geração redundante de tokens e melhorando a eficiência do cache KV em sessões longas de agente

Requisitos de hardware

Em Q4_K_M, o modelo usa ~16,8GB de VRAM, cabendo confortavelmente em uma única placa de 24GB (ex.: RTX 3090/4090, A10G). Em contraste, o Qwen3-Coder-Next (80B MoE, 3B ativos) requer 45–80GB na mesma quantização, limitando-o a configurações de duas GPUs ou Apple Silicon com 48GB+ de memória unificada.

Ressalvas e pegadinhas

NÃO use CUDA 13.2 — ele produz saída incorreta. Mantenha-se no CUDA 13.1 ou 12.x.
Para usuários que já executam Coder-Next em hardware de 48GB+ para tarefas agentivas, a troca não é obviamente benéfica.
Para usuários de GPU única que estão presos a modelos de codificação locais antigos ou mais fracos, o Qwen3.6-27B é atualmente a opção mais capaz no nível de 24GB.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

News

Claude Code v2.1.89 adiciona ganchos deferíveis, repetição de permissão e corrige vazamentos de memória.

Claude Code v2.1.89 introduz uma decisão de permissão 'defer' para ganchos PreToolUse, adiciona um gancho PermissionDenied com capacidade de repetição e corrige problemas críticos, incluindo vazamentos de memória com grandes entradas JSON e falhas no cache de esquema StructuredOutput.

Apr 1, 2026, 07:45 PM UTC

OpenClawRadar

News

Sociedade Sintética: Agentes de IA Construindo Vidas Virtuais no Moltbook

Nenhum

Feb 7, 2026, 03:58 PM UTC

r/moltbot community

News

A atualização automática do Cron quebrou o OpenClaw devido a um erro de validação de configuração.

Um trabalho cron configurado para atualizar automaticamente o OpenClaw encontrou um problema de validação de configuração com o campo cliBackends, causando perda de conexão. A correção envolveu remover a seção problemática e reiniciar o gateway.

Apr 21, 2026, 04:33 PM UTC

OpenClawRadar

News

O modelo de IA Mythos da Anthropic, Claude, foi revelado em vazamento de dados, descrito como 'mudança de paradigma' em capacidades

A Anthropic está testando um novo modelo de IA chamado Claude Mythos (também conhecido como Capybara) que representa uma 'mudança de patamar' no desempenho, com pontuações dramaticamente mais altas em testes de codificação de software, raciocínio acadêmico e cibersegurança em comparação com o Claude Opus 4.6. A existência do modelo foi revelada por meio de um vazamento de dados de um cache de dados não seguro e publicamente acessível contendo aproximadamente 3.000 ativos não publicados.

Mar 27, 2026, 09:45 AM UTC

OpenClawRadar