Pantheon-Reasoning-27B: Модель плотного рассуждения RP от Gryphe

Gryphe выпустил Pantheon-Reasoning-27B — доработанную модель рассуждений для ролевых игр на базе llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved. Модель призвана внедрить структурированное мышление в работу с персонажами — оценивать тон, планировать повествовательные ходы и обдумывать, как персонаж на самом деле отреагирует, прежде чем генерировать реплику.
Состав обучающих данных (все с полными цепочками рассуждений):
- Данные Pantheon (~28%) — основной корпус ролевых игр с обратно сгенерированными цепочками рассуждений
- Opus-4.6-Reasoning-24k (~21%) — очищенные цепочки рассуждений Claude Opus 4.6 для STEM, программирования и следования инструкциям
- Данные WorldSim (~16%) — длинные нарративные ролевые игры на Opus 4.6 с нативными рассуждениями, в основном от третьего лица в настоящем времени
- Данные текстовых квестов (~16%) — интерактивная литература и текстовые квесты с обратно сгенерированными рассуждениями
- Общие данные ролевых игр (~16%) — разнообразные транскрипты ролевых игр с обратно сгенерированными рассуждениями
- Данные Tiamat (~3%) — набор данных персонажей/RP из Tiamat-24B-Magistral с многоэтапным конвейером улучшений, рассуждения обратно сгенерированы для каждого обмена
Модель обучалась с preserve_thinking: true, поэтому теги мышления остаются активными на всех ходах ассистента в многоходовых диалогах, а не только на первом.
Доступны квантизации GGUF для локального вывода. Выбор базовой модели (Qwen 3.6 27B) был сделан намеренно для уменьшения отказов и улучшения писательских способностей. Gryphe отмечает, что рассматривал Gemma 4 31B, но счел её «абсолютно мучительной для обучения» из-за архитектурных особенностей.
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Убийственные функции OpenClaw и риски (с решениями)
Изучите выдающиеся особенности OpenClaw, связанные с потенциальными рисками и инновационными решениями для их смягчения.

Пользователь Reddit утверждает, что разработчикам следует перейти от чистого кодирования к архитектуре моделей с помощью AI-агентов.
В посте на Reddit утверждается, что разработчикам, использующим ИИ-агенты для написания кода, такие как Claude, следует перестать сосредотачиваться на написании чистого кода и вместо этого стать «архитекторами моделей», которые управляют ИИ-системами. Автор делится конкретными техниками, включая создание «логических карт» перед кодированием и отношение к промптам как к дизайн-ревью.

Использование API артефактов Claude учитывается в квоте чата, а не в биллинге API.
Использование артефактов Claude внутри Claude приводит к обычным API-вызовам, которые перехватываются Anthropic и аутентифицируются через активную сессию, засчитываясь в квоту чата плана, а не в API-биллинг. Пользователи могут проверить это, протестировав артефакты и убедившись, что использование API в Claude Console остаётся нулевым.
