Савант Коммандер 48B: Пользовательская модель Qwen 3 со смесью экспертов, включающая 12 дистиллированных моделей

✍️ OpenClawRadar📅 Опубликовано: 24 марта 2026 г.🔗 Source
Савант Коммандер 48B: Пользовательская модель Qwen 3 со смесью экспертов, включающая 12 дистиллированных моделей
Ad

Savant Commander 48B — это кастомная модель с архитектурой Mixture-of-Experts (MOE), построенная на основе Qwen 3, которая объединяет 12 дистиллированных моделей от различных провайдеров, включая Claude, Gemini, OpenAI и Deepseek. Модель использует ручную маршрутизацию для изоляции каждого дистиллята, одновременно позволяя устанавливать связи между ними.

Ключевые особенности и архитектура

  • Основана на Qwen 3 с длиной контекста 256K
  • Структура MOE 4x12B (всего 48B параметров)
  • Кастомная маршрутизация изолирует каждую дистиллированную модель, сохраняя межмодельные связи
  • Активация по запросу — пользователи могут выбирать, какую дистиллированную модель(и) использовать
  • Позволяет напрямую сравнивать различные дистиллированные модели с использованием идентичных запросов
Ad

Варианты модели и доступность

Проект включает как обычную, так и нецензурированную («Heretic») версии. Нецензурированная версия была создана путём применения процесса Heretic к каждой отдельной модели перед добавлением их в структуру MOE, а не к целой MOE.

Доступные форматы GGUF:

  • Обычная версия: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
  • Нецензурированная версия: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Исходные репозитории:

  • Обычная: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
  • Нецензурированная: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

Практическое применение

Маршрутизация по запросу в этой модели позволяет разработчикам тестировать и сравнивать результаты различных дистиллированных моделей, используя одинаковые запросы. Функции управления и контроля документированы в карточке репозитория с подробными инструкциями.

Такой подход к архитектуре MOE предоставляет практичный способ использовать несколько специализированных моделей в рамках единой системы вывода, что особенно полезно для сравнения поведения моделей или выбора конкретных характеристик модели для различных задач.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Инструмент с открытым исходным кодом позволяет Claude напрямую управлять Unreal Engine.
Инструменты

Инструмент с открытым исходным кодом позволяет Claude напрямую управлять Unreal Engine.

soft-ue-cli — это инструмент на Python с плагином на C++, который позволяет Claude Code и Claude Desktop выполнять команды в Unreal Engine без взаимодействия с редактором, предоставляя более 60 операций, включая редактирование блюпринтов, создание акторов и профилирование производительности.

OpenClawRadar
OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude
Инструменты

OpenHelm: Приложение для macOS для автоматизации задач кодирования с помощью Claude

OpenHelm — это бесплатное локальное приложение для macOS, которое автоматизирует повторяющиеся задачи кодирования в Claude, запуская задания по расписанию, автоматически повторяя неудачные попытки и разбивая работу на части, чтобы избежать ограничений сессий. Оно использует вашу существующую подписку Claude для вызовов LLM.

OpenClawRadar
Исследование Руководства по Кодам Клода: Минималистский подход в 65 строках
Инструменты

Исследование Руководства по Кодам Клода: Минималистский подход в 65 строках

Расширение Claude Code охватывает основные принципы ИИ-кодирования всего в 65 строках Markdown, акцентируя внимание на 'Думай прежде, чем кодировать'. Несмотря на свою простоту, оно получило значительное признание среди разработчиков.

OpenClawRadar
AutoBe: Как слабые локальные LLM исправили архитектуру генератора AI-бэкенда
Инструменты

AutoBe: Как слабые локальные LLM исправили архитектуру генератора AI-бэкенда

AutoBe — это открытый ИИ-агент, который создаёт полноценные бэкенд-приложения с использованием TypeScript, NestJS и Prisma. Команда обнаружила, что их первоначальный 100% успех компиляции давал неподдерживаемый код, затем они перестроили систему на модульную генерацию — что уронило успех до 40% — и использовали слабые локальные LLM, такие как qwen3-30b-a3b-thinking, для отладки неоднозначностей в схемах.

OpenClawRadar