Савант Коммандер 48B: Пользовательская модель Qwen 3 со смесью экспертов, включающая 12 дистиллированных моделей

Savant Commander 48B — это кастомная модель с архитектурой Mixture-of-Experts (MOE), построенная на основе Qwen 3, которая объединяет 12 дистиллированных моделей от различных провайдеров, включая Claude, Gemini, OpenAI и Deepseek. Модель использует ручную маршрутизацию для изоляции каждого дистиллята, одновременно позволяя устанавливать связи между ними.
Ключевые особенности и архитектура
- Основана на Qwen 3 с длиной контекста 256K
- Структура MOE 4x12B (всего 48B параметров)
- Кастомная маршрутизация изолирует каждую дистиллированную модель, сохраняя межмодельные связи
- Активация по запросу — пользователи могут выбирать, какую дистиллированную модель(и) использовать
- Позволяет напрямую сравнивать различные дистиллированные модели с использованием идентичных запросов
Варианты модели и доступность
Проект включает как обычную, так и нецензурированную («Heretic») версии. Нецензурированная версия была создана путём применения процесса Heretic к каждой отдельной модели перед добавлением их в структуру MOE, а не к целой MOE.
Доступные форматы GGUF:
- Обычная версия:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF - Нецензурированная версия:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF
Исходные репозитории:
- Обычная:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill - Нецензурированная:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored
Практическое применение
Маршрутизация по запросу в этой модели позволяет разработчикам тестировать и сравнивать результаты различных дистиллированных моделей, используя одинаковые запросы. Функции управления и контроля документированы в карточке репозитория с подробными инструкциями.
Такой подход к архитектуре MOE предоставляет практичный способ использовать несколько специализированных моделей в рамках единой системы вывода, что особенно полезно для сравнения поведения моделей или выбора конкретных характеристик модели для различных задач.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Инструмент с открытым исходным кодом позволяет Claude напрямую управлять Unreal Engine.
soft-ue-cli — это инструмент на Python с плагином на C++, который позволяет Claude Code и Claude Desktop выполнять команды в Unreal Engine без взаимодействия с редактором, предоставляя более 60 операций, включая редактирование блюпринтов, создание акторов и профилирование производительности.

OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude
OpenHelm — это бесплатное локальное приложение для macOS, которое автоматизирует повторяющиеся задачи кодирования в Claude, запуская задания по расписанию, автоматически повторяя неудачные попытки и разбивая работу на части, чтобы избежать ограничений сессий. Оно использует вашу существующую подписку Claude для вызовов LLM.

Исследование Руководства по Кодам Клода: Минималистский подход в 65 строках
Расширение Claude Code охватывает основные принципы ИИ-кодирования всего в 65 строках Markdown, акцентируя внимание на 'Думай прежде, чем кодировать'. Несмотря на свою простоту, оно получило значительное признание среди разработчиков.

AutoBe: Как слабые локальные LLM исправили архитектуру генератора AI-бэкенда
AutoBe — это открытый ИИ-агент, который создаёт полноценные бэкенд-приложения с использованием TypeScript, NestJS и Prisma. Команда обнаружила, что их первоначальный 100% успех компиляции давал неподдерживаемый код, затем они перестроили систему на модульную генерацию — что уронило успех до 40% — и использовали слабые локальные LLM, такие как qwen3-30b-a3b-thinking, для отладки неоднозначностей в схемах.