Savant Commander 48B: Qwen 3 MoE com 12 Modelos Destilados

Savant Commander 48B é um modelo personalizado Mixture-of-Experts (MOE) construído na arquitetura Qwen 3 que combina 12 modelos destilados de vários provedores, incluindo Claude, Gemini, OpenAI e Deepseek. O modelo usa roteamento codificado manualmente para isolar cada destilação enquanto permite conexões entre elas simultaneamente.

Características e Arquitetura Principais

Baseado no Qwen 3 com contexto de 256K
Estrutura MOE 4x12B (48B parâmetros totais)
Roteamento personalizado isola cada modelo destilado mantendo conexões inter-modelos
Ativação controlada por prompt - usuários podem selecionar qual(is) modelo(s) destilado(s) usar
Permite comparação direta entre diferentes modelos destilados usando prompts idênticos

Variantes do Modelo e Disponibilidade

O projeto inclui versões regulares e não censuradas ("Heretic"). A versão não censurada foi criada aplicando o processo Heretic a cada modelo individual antes de adicioná-los à estrutura MOE, em vez de aplicá-lo a todo o MOE.

Formatos GGUF disponíveis:

Versão regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
Versão não censurada: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Repositórios fonte:

Regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
Não censurado: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

Aplicações Práticas

O roteamento controlado por prompt do modelo permite que desenvolvedores testem e comparem saídas de diferentes modelos destilados usando os mesmos prompts. As funções de comando e controle estão documentadas no cartão do repositório com instruções detalhadas.

Esta abordagem de arquitetura MOE fornece uma maneira prática de aproveitar múltiplos modelos especializados dentro de uma única estrutura de inferência, particularmente útil para comparar comportamentos de modelos ou selecionar características específicas de modelos para diferentes tarefas.

📖 Read the full source: r/LocalLLaMA

Savant Commander 48B: Um Modelo Personalizado Qwen 3 de Mistura de Especialistas com 12 Modelos Destilados

Características e Arquitetura Principais

Variantes do Modelo e Disponibilidade

Aplicações Práticas

👀 See Also

Rival-Review: Um Ciclo de Revisão Intermodelos para Planos de Agentes de IA

Eqho: Aplicativo Local de Voz para Texto para Sessões de Código do Claude

Configuração do iTerm2 com 4 Painéis para CLI de Código do Claude Separa Funções da IA

Termrender: Visualização de Interface ASCII 6x Mais Eficiente em Tokens para Claude