Savant Commander 48B: Un modelo personalizado Qwen 3 de Mezcla de Expertos con 12 modelos destilados

✍️ OpenClawRadar📅 Publicado: 24 de marzo de 2026🔗 Source
Savant Commander 48B: Un modelo personalizado Qwen 3 de Mezcla de Expertos con 12 modelos destilados
Ad

Savant Commander 48B es un modelo personalizado de Mezcla de Expertos (MOE) construido sobre la arquitectura Qwen 3 que combina 12 modelos destilados de varios proveedores, incluyendo Claude, Gemini, OpenAI y Deepseek. El modelo utiliza enrutamiento codificado manualmente para aislar cada destilado mientras permite conexiones entre ellos simultáneamente.

Características y Arquitectura Clave

  • Basado en Qwen 3 con longitud de contexto de 256K
  • Estructura MOE 4x12B (48B parámetros totales)
  • Enrutamiento personalizado aísla cada modelo destilado mientras mantiene conexiones inter-modelo
  • Activación controlada por prompt - los usuarios pueden seleccionar qué modelo(s) destilado(s) usar
  • Permite comparación directa entre diferentes modelos destilados usando prompts idénticos

Variantes del Modelo y Disponibilidad

El proyecto incluye versiones regulares y sin censura ("Heretic"). La versión sin censura se creó aplicando el proceso Heretic a cada modelo individual antes de agregarlos a la estructura MOE, en lugar de aplicarlo a todo el MOE.

Formatos GGUF disponibles:

  • Versión regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
  • Versión sin censura: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Repositorios fuente:

  • Regular: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
  • Sin censura: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored
Ad

Aplicaciones Prácticas

El enrutamiento controlado por prompt del modelo permite a los desarrolladores probar y comparar salidas de diferentes modelos destilados usando los mismos prompts. Las funciones de comando y control están documentadas en la tarjeta del repositorio con instrucciones detalladas.

Este enfoque de arquitectura MOE proporciona una forma práctica de aprovechar múltiples modelos especializados dentro de un único marco de inferencia, particularmente útil para comparar comportamientos de modelos o seleccionar características específicas de modelos para diferentes tareas.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

mencionado.to vs herramientas de monitoreo más amplias: una comparación de flujo de trabajo centrado en Reddit
Herramientas

mencionado.to vs herramientas de monitoreo más amplias: una comparación de flujo de trabajo centrado en Reddit

mentioned.to es una herramienta de monitoreo diseñada específicamente para flujos de trabajo en Reddit, centrándose en el seguimiento de publicaciones relevantes, destacando oportunidades de respuesta, analizando contenido exitoso y redactando respuestas, en lugar de realizar un monitoreo amplio de marca en múltiples canales.

OpenClawRadar
ClaudeOrb: Extensión de Chrome Monitorea el Uso de la API de Claude en Tiempo Real
Herramientas

ClaudeOrb: Extensión de Chrome Monitorea el Uso de la API de Claude en Tiempo Real

Un desarrollador creó ClaudeOrb, una extensión gratuita de Chrome que muestra el porcentaje de sesión de Claude, los límites semanales, temporizadores de cuenta regresiva, costos de Claude Code y tendencias de gasto de 7 días. La herramienta se creó usando Claude Code después de alcanzar límites de tasa sin previo aviso.

OpenClawRadar
Resumen de reuniones en una GPU de 6GB: qwen3.5:0.8B funciona en 57s, Granite 4 350M alucina
Herramientas

Resumen de reuniones en una GPU de 6GB: qwen3.5:0.8B funciona en 57s, Granite 4 350M alucina

VoiceFlow v1.6.0 añade grabación y resumen de reuniones locales. Evaluación de modelos sub-1B en una RTX 3060 de 6GB: qwen3.5:0.8B produce resúmenes estructurados en 57s usando 2.2GB de VRAM, mientras que Granite 4 350M alucina gravemente.

OpenClawRadar
Claude Code Skill Refactoriza Componentes React Usando Principios de 'No Me Hagas Pensar'
Herramientas

Claude Code Skill Refactoriza Componentes React Usando Principios de 'No Me Hagas Pensar'

Una nueva habilidad de Claude Code refactoriza automáticamente componentes React para mejorar la usabilidad basándose en los principios de Steve Krug: elimina el relleno, destaca las llamadas a la acción principales, corrige estados vacíos y de error, y ajusta las etiquetas.

OpenClawRadar