Pantheon-Reasoning-27B: Ein dichtes Reasoning-RP-Modell von Gryphe

✍️ OpenClawRadar📅 Veröffentlicht: 17. Juni 2026🔗 Source
Pantheon-Reasoning-27B: Ein dichtes Reasoning-RP-Modell von Gryphe
Ad

Gryphe hat Pantheon-Reasoning-27B veröffentlicht, ein feinabgestimmtes Reasoning-Modell für Rollenspiele, das auf llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved basiert. Das Modell zielt darauf ab, strukturiertes Denken in die Charakterarbeit einzubringen – den Ton abwägen, narrative Schläge planen und überlegen, wie ein Charakter tatsächlich reagieren würde, bevor eine Zeile generiert wird.

Die Zusammensetzung der Trainingsdaten (alle mit vollständigen Reasoning-Spuren):

  • Pantheon-Daten (~28%) – Kern-Rollenspiel-Korpus mit zurückgenerierten Reasoning-Spuren
  • Opus-4.6-Reasoning-24k (~21%) – bereinigte Claude Opus 4.6 Reasoning-Spuren für MINT, Programmierung und Befehlsausführung
  • WorldSim-Daten (~16%) – Langform-Opus-4.6-Erzählrollenspiel mit nativem Reasoning, hauptsächlich dritte Person Präsens
  • Textadventure-Daten (~16%) – interaktive Fiktion und Textadventure-Inhalte mit zurückgeneriertem Reasoning
  • Allgemeine Rollenspieldaten (~16%) – verschiedene Rollenspiel-Transkripte mit zurückgeneriertem Reasoning
  • Tiamat-Daten (~3%) – Charakter-/RP-Datensatz von Tiamat-24B-Magistral mit mehrstufiger Verbesserungspipeline, Reasoning pro Austausch zurückgeneriert

Das Modell wurde mit preserve_thinking: true trainiert, sodass Denk-Tags über alle Assistenten-Turns in Multi-Turn-Gesprächen aktiv bleiben – nicht nur im ersten.

Ad

GGUF-Quants sind für die lokale Inferenz verfügbar. Die Wahl des Basismodells (Qwen 3.6 27B) erfolgte absichtlich zur Reduzierung von Verweigerungen und zur Verbesserung der Schreibfähigkeit. Gryphe merkt an, dass sie Gemma 4 31B in Betracht gezogen haben, es aber aufgrund architektonischer Eigenheiten als „absolute Pain zu trainieren“ empfanden.

📖 Vollständige Quelle lesen: r/LocalLLaMA

Ad

👀 Siehe auch