Savant Commander 48B: MoE-Modell mit 12 destillierten Modellen

Savant Commander 48B ist ein benutzerdefiniertes Mixture-of-Experts (MOE)-Modell, das auf der Qwen 3-Architektur basiert und 12 destillierte Modelle von verschiedenen Anbietern wie Claude, Gemini, OpenAI und Deepseek kombiniert. Das Modell verwendet handkodiertes Routing, um jedes Destillat zu isolieren, während gleichzeitig Verbindungen zwischen ihnen aufrechterhalten werden.

Wichtige Merkmale und Architektur

Basierend auf Qwen 3 mit 256K Kontextlänge
4x12B MOE-Struktur (48B Gesamtparameter)
Benutzerdefiniertes Routing isoliert jedes destillierte Modell, während Verbindungen zwischen den Modellen erhalten bleiben
Promptgesteuerte Aktivierung – Benutzer können auswählen, welches destillierte Modell(e) verwendet werden soll
Ermöglicht direkte Vergleiche zwischen verschiedenen destillierten Modellen mit identischen Prompts

Modellvarianten und Verfügbarkeit

Das Projekt umfasst sowohl reguläre als auch unzensierte ("Heretic") Versionen. Die unzensierte Version wurde erstellt, indem der Heretic-Prozess auf jedes einzelne Modell angewendet wurde, bevor sie zur MOE-Struktur hinzugefügt wurden, anstatt ihn auf das gesamte MOE anzuwenden.

Verfügbare GGUF-Formate:

Reguläre Version: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
Unzensierte Version: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Source repositories:

Regulär: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
Unzensiert: https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

Praktische Anwendungen

Die promptgesteuerte Routing-Funktion des Modells ermöglicht es Entwicklern, Ausgaben verschiedener destillierter Modelle mit denselben Prompts zu testen und zu vergleichen. Befehls- und Steuerungsfunktionen sind in der Repository-Karte mit detaillierten Anweisungen dokumentiert.

Dieser Ansatz zur MOE-Architektur bietet eine praktische Möglichkeit, mehrere spezialisierte Modelle innerhalb eines einzigen Inferenz-Frameworks zu nutzen, was besonders nützlich ist, um Modellverhalten zu vergleichen oder spezifische Modelleigenschaften für verschiedene Aufgaben auszuwählen.

📖 Read the full source: r/LocalLLaMA

Savant Commander 48B: Ein benutzerdefiniertes Qwen 3 Mixture-of-Experts-Modell mit 12 destillierten Modellen

Wichtige Merkmale und Architektur

Modellvarianten und Verfügbarkeit

Praktische Anwendungen

👀 Siehe auch

OpenClaw Multi-Agent-Workflow-Probleme: Stillstand, Kontextverlust und Token-Ineffizienz

Cortex v1.2 fügt LLM-Anreicherung, Q&A mit Quellenangaben und Konfliktlösung hinzu.

MegaClaw: Containerisierte OpenClaw-Einrichtung mit Playwright und Homebrew

Mehrfach-Anbieter-LLM-Fallback-Kette mit Ollama-Unterstützung in der produktiven KI-IDE