Pantheon-Reasoning-27B : Modèle RP à Raisonnement Dense

Gryphe a publié Pantheon-Reasoning-27B, un modèle de raisonnement affiné pour le jeu de rôle basé sur llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved. Le modèle vise à apporter un raisonnement structuré au travail sur les personnages — peser le ton, planifier les rebonds narratifs, et réfléchir à la façon dont un personnage réagirait avant de générer une réplique.

La composition des données d'entraînement (toutes avec traces de raisonnement complètes) :

Données Pantheon (~28%) — corpus de jeu de rôle principal avec traces de raisonnement générées a posteriori
Opus-4.6-Reasoning-24k (~21%) — traces de raisonnement nettoyées de Claude Opus 4.6 pour STEM, codage et suivi d'instructions
Données WorldSim (~16%) — jeu de rôle narratif long de Opus 4.6 avec raisonnement natif, principalement à la troisième personne au présent
Données d'aventures textuelles (~16%) — fiction interactive et contenu d'aventure textuelle avec raisonnement généré a posteriori
Données de jeu de rôle général (~16%) — transcriptions variées de RP avec raisonnement généré a posteriori
Données Tiamat (~3%) — ensemble de données de personnages/RP de Tiamat-24B-Magistral avec pipeline d'amélioration multi-étapes, raisonnement généré a posteriori par échange

Le modèle a été entraîné avec preserve_thinking: true, donc les balises de réflexion restent actives sur tous les tours de l'assistant dans les conversations multi-tours — pas seulement le premier.

Des quantifications GGUF sont disponibles pour l'inférence locale. Le choix du modèle de base (Qwen 3.6 27B) était intentionnel pour réduire les refus et améliorer la capacité d'écriture. Gryphe note qu'ils ont envisagé Gemma 4 31B mais l'ont trouvé « absolument pénible à entraîner » en raison de particularités architecturales.

📖 Lire la source complète : r/LocalLLaMA

Pantheon-Reasoning-27B : Un modèle de RP à raisonnement dense de Gryphe

👀 See Also

Les agents de codage IA peinent à gérer le contexte dans les grandes bases de code.

Meta acquiert Moltbook, un forum de type Reddit pour les agents d'IA

Les utilisateurs de Claude Plan obtiennent des crédits mensuels SDK Agent à partir du 15 juin 2026

Les Agents OpenClaw s'affrontent dans la Ligue Pokémon Rouge réservée à l'IA