Pantheon-Reasoning-27B: Модель RP с плотными рассуждениями

Gryphe выпустил Pantheon-Reasoning-27B — доработанную модель рассуждений для ролевых игр на базе llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved. Модель призвана внедрить структурированное мышление в работу с персонажами — оценивать тон, планировать повествовательные ходы и обдумывать, как персонаж на самом деле отреагирует, прежде чем генерировать реплику.

Состав обучающих данных (все с полными цепочками рассуждений):

Данные Pantheon (~28%) — основной корпус ролевых игр с обратно сгенерированными цепочками рассуждений
Opus-4.6-Reasoning-24k (~21%) — очищенные цепочки рассуждений Claude Opus 4.6 для STEM, программирования и следования инструкциям
Данные WorldSim (~16%) — длинные нарративные ролевые игры на Opus 4.6 с нативными рассуждениями, в основном от третьего лица в настоящем времени
Данные текстовых квестов (~16%) — интерактивная литература и текстовые квесты с обратно сгенерированными рассуждениями
Общие данные ролевых игр (~16%) — разнообразные транскрипты ролевых игр с обратно сгенерированными рассуждениями
Данные Tiamat (~3%) — набор данных персонажей/RP из Tiamat-24B-Magistral с многоэтапным конвейером улучшений, рассуждения обратно сгенерированы для каждого обмена

Модель обучалась с preserve_thinking: true, поэтому теги мышления остаются активными на всех ходах ассистента в многоходовых диалогах, а не только на первом.

Доступны квантизации GGUF для локального вывода. Выбор базовой модели (Qwen 3.6 27B) был сделан намеренно для уменьшения отказов и улучшения писательских способностей. Gryphe отмечает, что рассматривал Gemma 4 31B, но счел её «абсолютно мучительной для обучения» из-за архитектурных особенностей.

📖 Читать полный источник: r/LocalLLaMA

Pantheon-Reasoning-27B: Модель плотного рассуждения RP от Gryphe

👀 Смотрите также

Убийственные функции OpenClaw и риски (с решениями)

Пользователь Reddit утверждает, что разработчикам следует перейти от чистого кодирования к архитектуре моделей с помощью AI-агентов.

Использование API артефактов Claude учитывается в квоте чата, а не в биллинге API.

Почему open source архитектура OpenClaw имеет значение