Savant Commander 48B : Un modèle personnalisé Qwen 3 à base de mélange d'experts, intégrant 12 modèles distillés

✍️ OpenClawRadar📅 Publié: March 24, 2026🔗 Source
Savant Commander 48B : Un modèle personnalisé Qwen 3 à base de mélange d'experts, intégrant 12 modèles distillés
Ad

Savant Commander 48B est un modèle personnalisé Mixture-of-Experts (MOE) construit sur l'architecture Qwen 3 qui combine 12 modèles distillés provenant de divers fournisseurs incluant Claude, Gemini, OpenAI et Deepseek. Le modèle utilise un routage codé manuellement pour isoler chaque distillation tout en permettant des connexions entre elles simultanément.

Caractéristiques et architecture principales

  • Basé sur Qwen 3 avec une longueur de contexte de 256K
  • Structure MOE 4x12B (48 milliards de paramètres au total)
  • Le routage personnalisé isole chaque modèle distillé tout en maintenant les connexions inter-modèles
  • Activation contrôlée par prompt - les utilisateurs peuvent sélectionner quel(s) modèle(s) distillé(s) utiliser
  • Permet la comparaison directe entre différents modèles distillés en utilisant des prompts identiques
Ad

Variantes du modèle et disponibilité

Le projet inclut à la fois des versions régulières et non censurées ("Hérétique"). La version non censurée a été créée en appliquant le processus Hérétique à chaque modèle individuel avant de les ajouter à la structure MOE, plutôt que de l'appliquer à l'ensemble du MOE.

Formats GGUF disponibles :

  • Version régulière : https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF
  • Version non censurée : https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

Dépôts sources :

  • Régulier : https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill
  • Non censuré : https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

Applications pratiques

Le routage contrôlé par prompt du modèle permet aux développeurs de tester et comparer les sorties de différents modèles distillés en utilisant les mêmes prompts. Les fonctions de commande et de contrôle sont documentées dans la fiche du dépôt avec des instructions détaillées.

Cette approche de l'architecture MOE offre un moyen pratique de tirer parti de plusieurs modèles spécialisés dans un cadre d'inférence unique, particulièrement utile pour comparer les comportements des modèles ou sélectionner des caractéristiques spécifiques de modèles pour différentes tâches.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

PhAIL Benchmark Évalue les Modèles VLA sur des Tâches Réelles de Robotique d'Entrepôt
Tools

PhAIL Benchmark Évalue les Modèles VLA sur des Tâches Réelles de Robotique d'Entrepôt

PhAIL est un benchmark pour robots réels qui teste quatre modèles vision-langage-action sur la préparation de commandes entre bacs à l'aide d'un robot Franka FR3. Le meilleur modèle a atteint 64 unités par heure, contre 330 UPH pour la téléopération humaine et plus de 1 300 UPH pour le travail manuel humain.

OpenClawRadar
Déclawé : Un Scanner de Logiciels Malveillants OpenClaw Piloté par la Communauté
Tools

Déclawé : Un Scanner de Logiciels Malveillants OpenClaw Piloté par la Communauté

Declawed est un nouveau scanner de logiciels malveillants OpenClaw SKILL.md axé sur la détection d'injections de prompts arbitraires, de contenu malveillant et de voleurs d'informations dans les compétences ClawHub.

OpenClawRadar
P2PCLAW : Un réseau pair-à-pair permettant aux agents d'IA de publier des sciences formellement vérifiées
Tools

P2PCLAW : Un réseau pair-à-pair permettant aux agents d'IA de publier des sciences formellement vérifiées

P2PCLAW est un réseau pair-à-pair où les agents d'IA et les chercheurs humains peuvent publier des résultats scientifiques validés par des preuves mathématiques formelles dans Lean 4. Le système utilise GUN.js et IPFS, avec une cryptographie post-quantique et des fonctionnalités de confidentialité pour une participation sécurisée.

OpenClawRadar
Mind Keg MCP : Mémoire persistante pour le code Claude et les agents compatibles MCP
Tools

Mind Keg MCP : Mémoire persistante pour le code Claude et les agents compatibles MCP

Mind Keg MCP v0.1.1 est un serveur MCP open source qui fournit une mémoire persistante pour Claude Code et d'autres agents compatibles MCP. Il stocke les apprentissages localement via SQLite et les récupère via une recherche sémantique, permettant aux assistants de codage IA de se souvenir du contexte entre les sessions.

OpenClawRadar