Pantheon-Reasoning-27B: Dichtes Reasoning-RP-Modell

Gryphe hat Pantheon-Reasoning-27B veröffentlicht, ein feinabgestimmtes Reasoning-Modell für Rollenspiele, das auf llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved basiert. Das Modell zielt darauf ab, strukturiertes Denken in die Charakterarbeit einzubringen – den Ton abwägen, narrative Schläge planen und überlegen, wie ein Charakter tatsächlich reagieren würde, bevor eine Zeile generiert wird.

Die Zusammensetzung der Trainingsdaten (alle mit vollständigen Reasoning-Spuren):

Pantheon-Daten (~28%) – Kern-Rollenspiel-Korpus mit zurückgenerierten Reasoning-Spuren
Opus-4.6-Reasoning-24k (~21%) – bereinigte Claude Opus 4.6 Reasoning-Spuren für MINT, Programmierung und Befehlsausführung
WorldSim-Daten (~16%) – Langform-Opus-4.6-Erzählrollenspiel mit nativem Reasoning, hauptsächlich dritte Person Präsens
Textadventure-Daten (~16%) – interaktive Fiktion und Textadventure-Inhalte mit zurückgeneriertem Reasoning
Allgemeine Rollenspieldaten (~16%) – verschiedene Rollenspiel-Transkripte mit zurückgeneriertem Reasoning
Tiamat-Daten (~3%) – Charakter-/RP-Datensatz von Tiamat-24B-Magistral mit mehrstufiger Verbesserungspipeline, Reasoning pro Austausch zurückgeneriert

Das Modell wurde mit preserve_thinking: true trainiert, sodass Denk-Tags über alle Assistenten-Turns in Multi-Turn-Gesprächen aktiv bleiben – nicht nur im ersten.

GGUF-Quants sind für die lokale Inferenz verfügbar. Die Wahl des Basismodells (Qwen 3.6 27B) erfolgte absichtlich zur Reduzierung von Verweigerungen und zur Verbesserung der Schreibfähigkeit. Gryphe merkt an, dass sie Gemma 4 31B in Betracht gezogen haben, es aber aufgrund architektonischer Eigenheiten als „absolute Pain zu trainieren“ empfanden.

📖 Vollständige Quelle lesen: r/LocalLLaMA

Pantheon-Reasoning-27B: Ein dichtes Reasoning-RP-Modell von Gryphe

👀 Siehe auch

CC v2.1.122: Entfernung von Systemanweisungen, Debugging-Update und Erhöhung der Planungssicherheit

Windows 11 2026 Update: Taskleisten-Neupositionierung, reduzierte Copilot-Funktion, Verbesserungen am Datei-Explorer

Melbourne Psychiater lehnt neue Patienten ab, die KI-Notizen nicht zustimmen

OpenClaw 5.4 fügt /steer- und /side-Befehle hinzu: Agent während der Aufgabe umleiten, ohne Kontext zu verlieren