사벤트 커맨더 48B: 12개의 증류 모델로 구성된 맞춤형 Qwen 3 전문가 혼합 모델

✍️ OpenClawRadar📅 게시일: March 24, 2026🔗 Source
사벤트 커맨더 48B: 12개의 증류 모델로 구성된 맞춤형 Qwen 3 전문가 혼합 모델
Ad

Savant Commander 48B는 Claude, Gemini, OpenAI, Deepseek 등 다양한 제공업체의 12개 증류 모델을 결합한 Qwen 3 아키텍처 기반의 맞춤형 Mixture-of-Experts(MOE) 모델입니다. 이 모델은 각 증류 모델을 분리하면서 동시에 모델 간 연결을 유지하기 위해 수동 코딩된 라우팅을 사용합니다.

주요 기능 및 아키텍처

  • 256K 컨텍스트 길이의 Qwen 3 기반
  • 4x12B MOE 구조(총 48B 매개변수)
  • 맞춤형 라우팅으로 각 증류 모델을 분리하면서 모델 간 연결 유지
  • 프롬프트 제어 활성화 - 사용자가 사용할 증류 모델 선택 가능
  • 동일한 프롬프트를 사용하여 서로 다른 증류 모델 간 직접 비교 가능

모델 변형 및 가용성

이 프로젝트에는 일반 버전과 검열되지 않은("Heretic") 버전이 포함되어 있습니다. 검열되지 않은 버전은 전체 MOE에 적용하는 대신 각 개별 모델에 Heretic 프로세스를 적용한 후 MOE 구조에 추가하여 생성되었습니다.

사용 가능한 GGUF 형식:

  • 일반 버전: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
  • 검열되지 않은 버전: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

소스 저장소:

  • 일반: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
  • 검열되지 않은: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored
Ad

실제 응용

이 모델의 프롬프트 제어 라우팅을 통해 개발자는 동일한 프롬프트를 사용하여 서로 다른 증류 모델의 출력을 테스트하고 비교할 수 있습니다. 명령 및 제어 기능은 저장소 카드에 자세한 지침과 함께 문서화되어 있습니다.

이러한 MOE 아키텍처 접근 방식은 단일 추론 프레임워크 내에서 여러 전문 모델을 활용하는 실용적인 방법을 제공하며, 특히 모델 동작 비교나 다양한 작업에 대한 특정 모델 특성 선택에 유용합니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

ATLAS: Qwen3-14B의 프론티어 수준 코딩 성능을 달성한 오픈소스 테스트 타임 컴퓨팅 파이프라인
Tools

ATLAS: Qwen3-14B의 프론티어 수준 코딩 성능을 달성한 오픈소스 테스트 타임 컴퓨팅 파이프라인

한 대학생이 Qwen3-14B를 기반으로 구축한 오픈소스 테스트 타임 컴퓨팅 파이프라인인 ATLAS를 개발했습니다. 이 시스템은 LiveCodeBench v5 문제에서 작업당 약 0.004달러의 전기 비용으로 74.6%의 pass@1 성능을 달성합니다. 복잡한 문제에서는 느리지만 GPT-5(84.6%) 및 Claude 4.5 Sonnet(71.4%)와 같은 최첨단 모델과 비슷한 성능을 제공합니다.

OpenClawRadar
Kanwas: 팀과 AI 에이전트를 위한 오픈소스 공유 컨텍스트 보드
Tools

Kanwas: 팀과 AI 에이전트를 위한 오픈소스 공유 컨텍스트 보드

Kanwas는 팀과 AI 에이전트가 문서, 증거, 결정을 캔버스에서 실시간으로 공유하고 라이브 스트리밍 도구 호출을 지원하는 오픈소스 멀티플레이어 워크스페이스입니다. Docker를 통해 자체 호스팅되며, Yjs와 BlockNote로 Git 기반 백업이 가능합니다.

OpenClawRadar
오픈소스 MCP 서버는 AI 에이전트가 라이트닝 네트워크를 통해 L402 결제를 처리할 수 있도록 지원합니다.
Tools

오픈소스 MCP 서버는 AI 에이전트가 라이트닝 네트워크를 통해 L402 결제를 처리할 수 있도록 지원합니다.

FastMCP로 구축된 Python MCP 플러그인은 HTTP 402 결제 필요 응답을 가로채 라이트닝 네트워크 인보이스를 결제하고 AI 에이전트를 위한 데이터를 검색합니다. 이 저장소에는 실제 자금을 사용하지 않고 테스트할 수 있는 로컬 더미 에이전트가 포함되어 있습니다.

OpenClawRadar
코딩 에이전트 구축을 위한 8K 컨텍스트: 플래너/실행기 분할, 토큰 예산 및 병렬 실행
Tools

코딩 에이전트 구축을 위한 8K 컨텍스트: 플래너/실행기 분할, 토큰 예산 및 병렬 실행

8K 토큰 제한에 맞춰 설계된 CLI 코딩 에이전트의 상세 분석: 플래너/실행자 아키텍처, 엄격한 토크 예산, 병렬 작업 실행을 사용합니다.

OpenClawRadar