Savant Commander 48B: modelo Qwen 3 con 12 destilados

Savant Commander 48B es un modelo personalizado de Mezcla de Expertos (MOE) construido sobre la arquitectura Qwen 3 que combina 12 modelos destilados de varios proveedores, incluyendo Claude, Gemini, OpenAI y Deepseek. El modelo utiliza enrutamiento codificado manualmente para aislar cada destilado mientras permite conexiones entre ellos simultáneamente.

Características y Arquitectura Clave

Basado en Qwen 3 con longitud de contexto de 256K
Estructura MOE 4x12B (48B parámetros totales)
Enrutamiento personalizado aísla cada modelo destilado mientras mantiene conexiones inter-modelo
Activación controlada por prompt - los usuarios pueden seleccionar qué modelo(s) destilado(s) usar
Permite comparación directa entre diferentes modelos destilados usando prompts idénticos

Variantes del Modelo y Disponibilidad

El proyecto incluye versiones regulares y sin censura ("Heretic"). La versión sin censura se creó aplicando el proceso Heretic a cada modelo individual antes de agregarlos a la estructura MOE, en lugar de aplicarlo a todo el MOE.

Formatos GGUF disponibles:

Versión regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
Versión sin censura: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Repositorios fuente:

Regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
Sin censura: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

Aplicaciones Prácticas

El enrutamiento controlado por prompt del modelo permite a los desarrolladores probar y comparar salidas de diferentes modelos destilados usando los mismos prompts. Las funciones de comando y control están documentadas en la tarjeta del repositorio con instrucciones detalladas.

Este enfoque de arquitectura MOE proporciona una forma práctica de aprovechar múltiples modelos especializados dentro de un único marco de inferencia, particularmente útil para comparar comportamientos de modelos o seleccionar características específicas de modelos para diferentes tareas.

📖 Read the full source: r/LocalLLaMA

Savant Commander 48B: Un modelo personalizado Qwen 3 de Mezcla de Expertos con 12 modelos destilados

Características y Arquitectura Clave

Variantes del Modelo y Disponibilidad

Aplicaciones Prácticas

👀 Ver también

Código Zap: Generador de Código de IA que Enseña a los Niños HTML/CSS/JS Real

singularity-claude: Un Motor de Habilidades Autoevolutivo para Claude Code

MarkView: Herramienta de código abierto que renderiza y gestiona archivos Markdown generados por IA

La herramienta de código abierto permite a Claude controlar Unreal Engine directamente.