Fusionar Modelos GGUF: Script Python Qwen3.5-35B + Claude

Un usuario de Reddit ha compartido un script de Python y un flujo de trabajo para fusionar archivos de modelo GGUF con pérdida mínima, específicamente dirigido a variantes de Qwen3.5-35B. El enfoque combina dos modelos existentes: Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive de HauhauCS y Qwen3.5-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF de samuelcardillo.

Detalles Técnicos

El modelo fusionado está disponible como versión cuantizada Q4_0 en Hugging Face. Según la fuente, el ajuste fino de samuelcardillo supera a la versión de Jackrong para Qwen 3.5 35B.

Flujo de Trabajo de Fusión

El script de Python (disponible en Pastebin) fue "vibecoded via Claude Opus 4.6" y soporta:

Fusión de archivos GGUF en Google Colab Free Tier
Cuantización mediante llama-quantize
Cuantización Q4_K_M para modelos 35B
Cuantización Q8 para modelos 8B

El autor señala que no puede crear versiones cuantizadas Q8_0 o F16 debido a limitaciones de espacio en disco en Google Colab Free tier, pero sugiere que otros pueden modificar el script mediante Claude Opus para esas cuantizaciones.

Configuraciones Óptimas

Para el mejor rendimiento en LM Studio, use estos parámetros:

Temperatura: 0.7
Muestreo Top K: 20
Penalización de Presencia: 1.5
Muestreo Top P: 0.8
Muestreo Min P: 0
Semilla: 3407 o 42

El prompt del sistema (versión completa en Pastebin) debe incluir esta primera línea: "Eres Qwen, creado por Alibaba Cloud. Eres un asistente útil." El autor señala que el modelo tiene un rendimiento inferior sin esta línea.

📖 Leer la fuente completa: r/LocalLLaMA

Script y Flujo de Trabajo para Fusión de Modelos GGUF de Variantes Qwen3.5-35B

Detalles Técnicos

Flujo de Trabajo de Fusión

Configuraciones Óptimas

👀 Ver también

Herramienta de Navegador de Código Abierto para Probar Servidores MCP Sin Instalación

Protocolo de Memoria Abierta: Un Almacén de Memoria para Claude, ChatGPT, Cursor

ProofShot CLI Brinda a los Agentes de Codificación con IA Capacidades de Verificación en el Navegador

x402 API Gateway para Bots OpenClaw: Un Único Punto de Acceso Reemplaza 18 Claves de API