GGUF-Modelle Zusammenführen: Skript & Workflow für Qwen3.5-35B

Ein Reddit-Nutzer hat ein Python-Skript und einen Arbeitsablauf zum Zusammenführen von GGUF-Modelldateien mit minimalem Verlust geteilt, der speziell auf Qwen3.5-35B-Varianten abzielt. Der Ansatz kombiniert zwei bestehende Modelle: HauhauCS' Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive und samuelcardillos Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF.

Technische Details

Das zusammengeführte Modell ist als Q4_0-quantisierte Version bei Hugging Face verfügbar. Laut Quelle übertrifft samuelcardillos Feinabstimmung die Version von Jackrong für Qwen 3.5 35B.

Zusammenführungs-Workflow

Das Python-Skript (verfügbar auf Pastebin) wurde "vibecoded via Claude Opus 4.6" und unterstützt:

Zusammenführung von GGUF-Dateien auf Google Colab Free Tier
Quantisierung via llama-quantize
Q4_K_M-Quantisierung für 35B-Modelle
Q8-Quantisierung für 8B-Modelle

Der Autor merkt an, dass er aufgrund von Speicherplatzbeschränkungen auf Google Colab Free Tier keine Q8_0- oder F16-quantisierten Versionen erstellen kann, schlägt aber vor, dass andere das Skript via Claude Opus für diese Quantisierungen anpassen können.

Optimale Einstellungen

Für beste Leistung in LM Studio verwenden Sie diese Parameter:

Temperatur: 0.7
Top-K-Sampling: 20
Präsenzstrafe: 1.5
Top-P-Sampling: 0.8
Min-P-Sampling: 0
Seed: 3407 oder 42

Die Systemaufforderung (vollständige Version auf Pastebin) sollte diese erste Zeile enthalten: "Du bist Qwen, erstellt von Alibaba Cloud. Du bist ein hilfreicher Assistent." Der Autor stellt fest, dass das Modell ohne diese Zeile schlechter abschneidet.

📖 Source: r/LocalLLaMA

GGUF-Modell-Zusammenführungs-Skript und Workflow für Qwen3.5-35B-Varianten

Technische Details

Zusammenführungs-Workflow

Optimale Einstellungen

👀 Siehe auch

Fantastisches OpenClaw-Fähigkeiten-Repository bietet über 5.400 gefilterte Fähigkeiten

Wie Clawdbot 6 KI-Agenten mit einer produktionsstabilen Work Queue koordiniert

SIDJUA v0.9.7: Open-Source Multi-Agent KI mit Durchsetzung von Governance vor der Aktion

Tripsy startet MCP-Server für Claude: Reisen über strukturierte API verwalten