사벤트 커맨더 48B: 12개 증류 모델로 구성된 맞춤형 Qwen 3 MoE 모델

Savant Commander 48B는 Claude, Gemini, OpenAI, Deepseek 등 다양한 제공업체의 12개 증류 모델을 결합한 Qwen 3 아키텍처 기반의 맞춤형 Mixture-of-Experts(MOE) 모델입니다. 이 모델은 각 증류 모델을 분리하면서 동시에 모델 간 연결을 유지하기 위해 수동 코딩된 라우팅을 사용합니다.

주요 기능 및 아키텍처

256K 컨텍스트 길이의 Qwen 3 기반
4x12B MOE 구조(총 48B 매개변수)
맞춤형 라우팅으로 각 증류 모델을 분리하면서 모델 간 연결 유지
프롬프트 제어 활성화 - 사용자가 사용할 증류 모델 선택 가능
동일한 프롬프트를 사용하여 서로 다른 증류 모델 간 직접 비교 가능

모델 변형 및 가용성

이 프로젝트에는 일반 버전과 검열되지 않은("Heretic") 버전이 포함되어 있습니다. 검열되지 않은 버전은 전체 MOE에 적용하는 대신 각 개별 모델에 Heretic 프로세스를 적용한 후 MOE 구조에 추가하여 생성되었습니다.

사용 가능한 GGUF 형식:

일반 버전: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
검열되지 않은 버전: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

소스 저장소:

일반: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
검열되지 않은: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored