Pantheon-Reasoning-27B: Gryphe의 고밀도 추론 RP 모델

✍️ OpenClawRadar📅 게시일: June 17, 2026🔗 Source
Pantheon-Reasoning-27B: Gryphe의 고밀도 추론 RP 모델
Ad

Gryphe가 Pantheon-Reasoning-27B를 출시했습니다. 이 모델은 llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved를 기반으로 롤플레이를 위한 파인튜닝된 추론 모델입니다. 이 모델은 캐릭터 작업에 구조화된 추론을 도입하여, 대사 생성 전에 어조를 평가하고, 내러티브 비트를 계획하며, 캐릭터의 실제 반응 방식을 고려하는 것을 목표로 합니다.

학습 데이터 구성(모두 완전한 추론 과정 포함):

  • Pantheon 데이터 (~28%) — 핵심 롤플레이 코퍼스에 역 생성된 추론 과정 포함
  • Opus-4.6-Reasoning-24k (~21%) — STEM, 코딩, 지시 수행을 위한 Claude Opus 4.6 추론 과정 정리
  • WorldSim 데이터 (~16%) — 긴 형식의 Opus 4.6 내러티브 롤플레이, 주로 3인칭 현재 시제, 고유 추론 포함
  • 텍스트 어드벤처 데이터 (~16%) — 인터랙티브 픽션 및 텍스트 어드벤처 콘텐츠에 역 생성된 추론 포함
  • 일반 롤플레이 데이터 (~16%) — 다양한 롤플레이 대화록에 역 생성된 추론 포함
  • Tiamat 데이터 (~3%) — Tiamat-24B-Magistral의 캐릭터/RP 데이터셋, 다단계 개선 파이프라인, 각 교환에 역 생성된 추론 포함

모델은 preserve_thinking: true로 학습되어, 다중 턴 대화에서 첫 번째 턴뿐만 아니라 모든 어시스턴트 턴에 thinking 태그가 활성화됩니다.

GGUF 양자화 파일은 로컬 추론에 사용할 수 있습니다. 기본 모델로 Qwen 3.6 27B를 선택한 것은 거부 감소와 글쓰기 능력 향상을 위한 의도적인 결정이었습니다. Gryphe는 Gemma 4 31B도 고려했지만, 아키텍처상의 문제로 인해 "훈련하기가 절대적으로 고통스럽다"고 언급했습니다.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

OpenClaw의 주요 기능과 위험 요소 (해결책 포함)
News

OpenClaw의 주요 기능과 위험 요소 (해결책 포함)

OpenClaw의 두드러진 기능, 그들이 내포하는 잠재적 위험, 그리고 이러한 도전을 완화하기 위한 혁신적인 해결책을 탐구해 보세요.

OpenClawRadar
Qwen 3 8B는 어려운 과제에 대한 블라인드 동료 평가에서 더 큰 모델들을 능가합니다.
News

Qwen 3 8B는 어려운 과제에 대한 블라인드 동료 평가에서 더 큰 모델들을 능가합니다.

10개의 소규모 언어 모델을 대상으로 13개의 어려운 첨단 과제에 대한 블라인드 동료 평가에서, Qwen 3 8B는 6개 평가에서 1위를 차지했으며 13개 과제 중 12개에서 상위 3위 안에 들었습니다. 이는 파라미터 수가 최대 4배 많은 모델들을 능가하는 성과입니다. 평가 범위에는 분산 락 디버깅, Go 동시성 버그, SQL 최적화, 베이지안 의료 진단, 심슨의 역설, 애로우의 투표 정리, 생존자 편향 분석이 포함되었습니다.

OpenClawRadar
OpenClaw의 아스트로터핑 캠페인과 $CLAWD 토큰 펌프 분석
News

OpenClaw의 아스트로터핑 캠페인과 $CLAWD 토큰 펌프 분석

레딧 조사 결과, OpenClaw의 1월 말 바이럴 성장은 약 400개의 봇 인스턴스를 사용한 재귀적 아스트로터핑 캠페인에 의해 주도되었으며, 이는 $CLAWD 토큰을 1600만 달러 시가총액까지 끌어올린 후 90% 급락시키기 위한 과대광고를 조성했습니다.

OpenClawRadar
Claude 디자인 청구 버그: 추가 사용량 구매 적용 안 됨, 지원 봇이 유료 사용자 가둠
News

Claude 디자인 청구 버그: 추가 사용량 구매 적용 안 됨, 지원 봇이 유료 사용자 가둠

Claude Design 사용자가 인앱 결제를 통해 $20를 추가 사용량으로 결제했지만, 크레딧이 Claude Design의 별도 사용 제한에 적용되지 않습니다. 지원 봇 Fin이 문제를 잘못 이해하고 관련 없는 응답을 반복하며 새 티켓을 차단하고 인간 에스컬레이션 경로가 없습니다.

OpenClawRadar