Savant Commander 48B: Ein benutzerdefiniertes Qwen 3 Mixture-of-Experts-Modell mit 12 destillierten Modellen

Savant Commander 48B ist ein benutzerdefiniertes Mixture-of-Experts (MOE)-Modell, das auf der Qwen 3-Architektur basiert und 12 destillierte Modelle von verschiedenen Anbietern wie Claude, Gemini, OpenAI und Deepseek kombiniert. Das Modell verwendet handkodiertes Routing, um jedes Destillat zu isolieren, während gleichzeitig Verbindungen zwischen ihnen aufrechterhalten werden.
Wichtige Merkmale und Architektur
- Basierend auf Qwen 3 mit 256K Kontextlänge
- 4x12B MOE-Struktur (48B Gesamtparameter)
- Benutzerdefiniertes Routing isoliert jedes destillierte Modell, während Verbindungen zwischen den Modellen erhalten bleiben
- Promptgesteuerte Aktivierung – Benutzer können auswählen, welches destillierte Modell(e) verwendet werden soll
- Ermöglicht direkte Vergleiche zwischen verschiedenen destillierten Modellen mit identischen Prompts
Modellvarianten und Verfügbarkeit
Das Projekt umfasst sowohl reguläre als auch unzensierte ("Heretic") Versionen. Die unzensierte Version wurde erstellt, indem der Heretic-Prozess auf jedes einzelne Modell angewendet wurde, bevor sie zur MOE-Struktur hinzugefügt wurden, anstatt ihn auf das gesamte MOE anzuwenden.
Verfügbare GGUF-Formate:
- Reguläre Version:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF - Unzensierte Version:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF
Source repositories:
- Regulär:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill - Unzensiert:
https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored
Praktische Anwendungen
Die promptgesteuerte Routing-Funktion des Modells ermöglicht es Entwicklern, Ausgaben verschiedener destillierter Modelle mit denselben Prompts zu testen und zu vergleichen. Befehls- und Steuerungsfunktionen sind in der Repository-Karte mit detaillierten Anweisungen dokumentiert.
Dieser Ansatz zur MOE-Architektur bietet eine praktische Möglichkeit, mehrere spezialisierte Modelle innerhalb eines einzigen Inferenz-Frameworks zu nutzen, was besonders nützlich ist, um Modellverhalten zu vergleichen oder spezifische Modelleigenschaften für verschiedene Aufgaben auszuwählen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Mind Keg MCP: Persistenter Speicher für Claude Code und MCP-kompatible Agenten
Mind Keg MCP v0.1.1 ist ein Open-Source-MCP-Server, der persistente Speicher für Claude Code und andere MCP-kompatible Agenten bereitstellt. Er speichert Erkenntnisse lokal über SQLite und ruft sie per semantischer Suche ab, sodass KI-Codierungsassistenten Kontext zwischen Sitzungen behalten können.

claude-powerline v1.20 fügt den TUI-Dashboard-Modus, Kontextleisten-Stile und die Anzeige von Umgebungsvariablen hinzu.
claude-powerline v1.20 führt einen TUI-Dashboard-Modus ein, der die einzelne Statuszeile durch ein vollständiges Panel ersetzt, das Modellinformationen, Kontextnutzung mit Fortschrittsbalken, Kosten, Git-Status und mehr anzeigt. Das Update fügt 9 visuelle Fortschrittsbalken-Stile für die Kontextnutzung und die Fähigkeit zur Anzeige von Umgebungsvariablen hinzu.

Bindungsprobleme: Ein Tool, das unvollendete GitHub-Repos analysiert und 'begräbt'
Ein Entwickler hat ein Tool namens Commitment Issues erstellt, das GitHub-Repositories analysiert, um festzustellen, ob sie aufgegeben wurden, einen 'Totenschein' generiert und die letzte Commit-Nachricht als 'letzte Worte' extrahiert. Das Tool verwendet Heuristiken wie Commit-Häufigkeit, letzte Aktivität und Sterne vs. Momentum und wurde mit Claude prototypisiert.

Specsmaxxing: KI-Psychose mit YAML-Spezifikationen und ACAI bekämpfen
Acai.sh stellt Specsmaxxing vor: eine Methode, um dem Kontextverlust von KI-Agenten entgegenzuwirken, indem Anforderungen in YAML geschrieben und nummerierte Akzeptanzkriterien für KI (ACAI) verwendet werden, auf die Agenten im Code verweisen.