Pantheon-Reasoning-27B: Ein dichtes Reasoning-RP-Modell von Gryphe

Gryphe hat Pantheon-Reasoning-27B veröffentlicht, ein feinabgestimmtes Reasoning-Modell für Rollenspiele, das auf llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved basiert. Das Modell zielt darauf ab, strukturiertes Denken in die Charakterarbeit einzubringen – den Ton abwägen, narrative Schläge planen und überlegen, wie ein Charakter tatsächlich reagieren würde, bevor eine Zeile generiert wird.
Die Zusammensetzung der Trainingsdaten (alle mit vollständigen Reasoning-Spuren):
- Pantheon-Daten (~28%) – Kern-Rollenspiel-Korpus mit zurückgenerierten Reasoning-Spuren
- Opus-4.6-Reasoning-24k (~21%) – bereinigte Claude Opus 4.6 Reasoning-Spuren für MINT, Programmierung und Befehlsausführung
- WorldSim-Daten (~16%) – Langform-Opus-4.6-Erzählrollenspiel mit nativem Reasoning, hauptsächlich dritte Person Präsens
- Textadventure-Daten (~16%) – interaktive Fiktion und Textadventure-Inhalte mit zurückgeneriertem Reasoning
- Allgemeine Rollenspieldaten (~16%) – verschiedene Rollenspiel-Transkripte mit zurückgeneriertem Reasoning
- Tiamat-Daten (~3%) – Charakter-/RP-Datensatz von Tiamat-24B-Magistral mit mehrstufiger Verbesserungspipeline, Reasoning pro Austausch zurückgeneriert
Das Modell wurde mit preserve_thinking: true trainiert, sodass Denk-Tags über alle Assistenten-Turns in Multi-Turn-Gesprächen aktiv bleiben – nicht nur im ersten.
GGUF-Quants sind für die lokale Inferenz verfügbar. Die Wahl des Basismodells (Qwen 3.6 27B) erfolgte absichtlich zur Reduzierung von Verweigerungen und zur Verbesserung der Schreibfähigkeit. Gryphe merkt an, dass sie Gemma 4 31B in Betracht gezogen haben, es aber aufgrund architektonischer Eigenheiten als „absolute Pain zu trainieren“ empfanden.
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

CC v2.1.122: Entfernung von Systemanweisungen, Debugging-Update und Erhöhung der Planungssicherheit
Claude Code CC v2.1.122 entfernt den eigenständigen Prompt für Phase vier des Planmodus, verbessert den Fallback des Daemon-Debug-Kontexts und erhöht die Konfidenzschwelle für das Angebot von /schedule von 70 %+ auf 85 %+.

Windows 11 2026 Update: Taskleisten-Neupositionierung, reduzierte Copilot-Funktion, Verbesserungen am Datei-Explorer
Microsoft führt 2026 Windows 11-Updates ein, die die Taskleistenpositionierung wiederherstellen, Copilot-Überladung in Kern-Apps reduzieren und die Datei-Explorer-Leistung basierend auf Nutzerfeedback verbessern.

Melbourne Psychiater lehnt neue Patienten ab, die KI-Notizen nicht zustimmen
Ein Psychiater in Melbourne verlangt von neuen Patienten die Zustimmung zur KI-Transkription von Sitzungen, andernfalls werden sie an andere Anbieter verwiesen – dies wirft Bedenken hinsichtlich Datensicherheit und Genauigkeit auf.

OpenClaw 5.4 fügt /steer- und /side-Befehle hinzu: Agent während der Aufgabe umleiten, ohne Kontext zu verlieren
OpenClaw 5.4 führt die Befehle /steer und /side ein, mit denen Sie die aktuelle Aufgabenrichtung eines Agenten umleiten oder eine Nebensächlichkeit beginnen können, ohne den Sitzungskontext zu verlieren.