Pantheon-Reasoning-27B: Gryphe의 고밀도 추론 RP 모델

Gryphe가 Pantheon-Reasoning-27B를 출시했습니다. 이 모델은 llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved를 기반으로 롤플레이를 위한 파인튜닝된 추론 모델입니다. 이 모델은 캐릭터 작업에 구조화된 추론을 도입하여, 대사 생성 전에 어조를 평가하고, 내러티브 비트를 계획하며, 캐릭터의 실제 반응 방식을 고려하는 것을 목표로 합니다.
학습 데이터 구성(모두 완전한 추론 과정 포함):
- Pantheon 데이터 (~28%) — 핵심 롤플레이 코퍼스에 역 생성된 추론 과정 포함
- Opus-4.6-Reasoning-24k (~21%) — STEM, 코딩, 지시 수행을 위한 Claude Opus 4.6 추론 과정 정리
- WorldSim 데이터 (~16%) — 긴 형식의 Opus 4.6 내러티브 롤플레이, 주로 3인칭 현재 시제, 고유 추론 포함
- 텍스트 어드벤처 데이터 (~16%) — 인터랙티브 픽션 및 텍스트 어드벤처 콘텐츠에 역 생성된 추론 포함
- 일반 롤플레이 데이터 (~16%) — 다양한 롤플레이 대화록에 역 생성된 추론 포함
- Tiamat 데이터 (~3%) — Tiamat-24B-Magistral의 캐릭터/RP 데이터셋, 다단계 개선 파이프라인, 각 교환에 역 생성된 추론 포함
모델은 preserve_thinking: true로 학습되어, 다중 턴 대화에서 첫 번째 턴뿐만 아니라 모든 어시스턴트 턴에 thinking 태그가 활성화됩니다.
GGUF 양자화 파일은 로컬 추론에 사용할 수 있습니다. 기본 모델로 Qwen 3.6 27B를 선택한 것은 거부 감소와 글쓰기 능력 향상을 위한 의도적인 결정이었습니다. Gryphe는 Gemma 4 31B도 고려했지만, 아키텍처상의 문제로 인해 "훈련하기가 절대적으로 고통스럽다"고 언급했습니다.
📖 전체 출처 읽기: r/LocalLLaMA
👀 See Also

OpenClaw의 주요 기능과 위험 요소 (해결책 포함)
OpenClaw의 두드러진 기능, 그들이 내포하는 잠재적 위험, 그리고 이러한 도전을 완화하기 위한 혁신적인 해결책을 탐구해 보세요.

Qwen 3 8B는 어려운 과제에 대한 블라인드 동료 평가에서 더 큰 모델들을 능가합니다.
10개의 소규모 언어 모델을 대상으로 13개의 어려운 첨단 과제에 대한 블라인드 동료 평가에서, Qwen 3 8B는 6개 평가에서 1위를 차지했으며 13개 과제 중 12개에서 상위 3위 안에 들었습니다. 이는 파라미터 수가 최대 4배 많은 모델들을 능가하는 성과입니다. 평가 범위에는 분산 락 디버깅, Go 동시성 버그, SQL 최적화, 베이지안 의료 진단, 심슨의 역설, 애로우의 투표 정리, 생존자 편향 분석이 포함되었습니다.

OpenClaw의 아스트로터핑 캠페인과 $CLAWD 토큰 펌프 분석
레딧 조사 결과, OpenClaw의 1월 말 바이럴 성장은 약 400개의 봇 인스턴스를 사용한 재귀적 아스트로터핑 캠페인에 의해 주도되었으며, 이는 $CLAWD 토큰을 1600만 달러 시가총액까지 끌어올린 후 90% 급락시키기 위한 과대광고를 조성했습니다.

Claude 디자인 청구 버그: 추가 사용량 구매 적용 안 됨, 지원 봇이 유료 사용자 가둠
Claude Design 사용자가 인앱 결제를 통해 $20를 추가 사용량으로 결제했지만, 크레딧이 Claude Design의 별도 사용 제한에 적용되지 않습니다. 지원 봇 Fin이 문제를 잘못 이해하고 관련 없는 응답을 반복하며 새 티켓을 차단하고 인간 에스컬레이션 경로가 없습니다.