Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados

Savant Commander 48B é um modelo personalizado Mixture-of-Experts (MOE) construído na arquitetura Qwen 3 que combina 12 modelos destilados de vários provedores, incluindo Claude, Gemini, OpenAI e Deepseek. O modelo usa roteamento codificado manualmente para isolar cada destilação enquanto permite conexões entre elas simultaneamente.
Características e Arquitetura Principais
- Baseado no Qwen 3 com contexto de 256K
- Estrutura MOE 4x12B (48B parâmetros totais)
- Roteamento personalizado isola cada modelo destilado mantendo conexões inter-modelos
- Ativação controlada por prompt - usuários podem selecionar qual(is) modelo(s) destilado(s) usar
- Permite comparação direta entre diferentes modelos destilados usando prompts idênticos
Variantes do Modelo e Disponibilidade
O projeto inclui versões regulares e não censuradas ("Heretic"). A versão não censurada foi criada aplicando o processo Heretic a cada modelo individual antes de adicioná-los à estrutura MOE, em vez de aplicá-lo a todo o MOE.
Formatos GGUF disponíveis:
- Versão regular:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF - Versão não censurada:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF
Repositórios fonte:
- Regular:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill - Não censurado:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored
Aplicações Práticas
O roteamento controlado por prompt do modelo permite que desenvolvedores testem e comparem saídas de diferentes modelos destilados usando os mesmos prompts. As funções de comando e controle estão documentadas no cartão do repositório com instruções detalhadas.
Esta abordagem de arquitetura MOE fornece uma maneira prática de aproveitar múltiplos modelos especializados dentro de uma única estrutura de inferência, particularmente útil para comparar comportamentos de modelos ou selecionar características específicas de modelos para diferentes tarefas.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Formatador de Mensagens do Slack: Corrija o Markdown Quebrado do Claude no Slack
Um desenvolvedor criou uma habilidade que converte Markdown gerado pelo Claude para a formatação adequada do Slack, resolvendo problemas onde texto em negrito aparece como asteriscos, links aparecem crus e tabelas quebram. A ferramenta oferece tanto uma pré-visualização no navegador com cópia e colagem de HTML rico quanto suporte a webhook via API.

Noren AI: Ferramenta de Extração de Voz Identifica Padrões de Escrita a partir de Amostras
A Noren AI analisa de 5 a 10 amostras de escrita para gerar automaticamente um guia de voz baseado em padrões reais, correspondendo a 90% dos padrões identificados manualmente e descobrindo outros adicionais.

Avaliando localmente Qwen 3.6 27B como co-agente validador de Codex
Um desenvolvedor criou um conjunto de avaliação reproduzível para testar perfis GGUF do Qwen 3.6 27B (llama.cpp) como um validador auxiliar para Codex, descobrindo que perfis de contexto 128k são necessários para tarefas de contexto longo e que há perda mínima de precisão com cache KV q8.

Claude Code v2.1.126: Seletor de Modelo, Limpeza de Projeto, Correções no OAuth e Melhorias de Segurança
Claude Code v2.1.126 adiciona um seletor /model para gateways compatíveis com Anthropic, um novo comando claude project purge, corrige o login OAuth em WSL2/SSH/containers e corrige problemas de segurança com configurações gerenciadas e exposição da área de transferência no Windows.