Modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2 Lanzado con Configuración de LM Studio

Detalles del Modelo y Disponibilidad
El modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-Q4_K_M-GGUF ya está disponible en HuggingFace. Este modelo fue creado fusionando dos modelos existentes: Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF de Jackrong y Qwen3.5-9B-Uncensored-HauhauCS-Aggressive de HauhauCS.
La fusión preserva todos los datos de entrenamiento y mantiene la precisión en la arquitectura Qwen 3.5 9B utilizando precisión Float32 durante el proceso de fusión. El modelo está entrenado en el conjunto de datos Claude Opus 4.6 disponible en https://huggingface.co/datasets/Roman1111111/claude-opus-4.6-10000x.
Configuración Recomendada
Para el mejor rendimiento en LM Studio 0.4.7 (compilación 4), utiliza estas configuraciones:
- Prompt del Sistema: https://pastebin.com/pU25DVnB
- Temperatura: 0.7
- Muestreo Top K: 20
- Penalización de Repetición: (desactivada) o 1.0
- Penalización de Presencia: 1.5
- Muestreo Top P: 0.8
- Muestreo Min P: 0.0
- Semilla: 3407
Rendimiento y Hardware
En una RTX 3060, el modelo alcanza 42 tokens por segundo en LM Studio. El creador señala que puede ejecutarse aún más rápido en llama-server. El modelo fue creado en respuesta a solicitudes de usuarios en Reddit y HuggingFace que deseaban una ventana de contexto grande en IA local inteligente sin censura sin requerir GPUs potentes.
El modelo está disponible en: https://huggingface.co/LuffyTheFox/Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-GGUF
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Elodin lanza su arnés de carreras de IA de código abierto con simulación en tiempo real de Betaflight para los participantes del AI Grand Prix
Elodin ha publicado un simulador open-source para la clasificación virtual del AI Grand Prix, que cumple con las restricciones de la competición y funciona con Betaflight real. La herramienta basada en Rust/Bevy genera muestras de sensores de cámara directamente en el bucle, evitando la sobrecarga de motores de juego pesados.

Proyecto de Implementación de Claude Code Hooks Cubre los 23 Hooks
Un desarrollador ha creado un proyecto que implementa los 23 ganchos de código Claude, una de las principales características que diferencia a Claude code de otros agentes CLI como Codex. El proyecto está construido completamente con código Claude.

Arquitectura de Compilador Determinista para Flujos de Trabajo de LLM de Múltiples Pasos Muestra Fuertes Resultados en Puntos de Referencia
Una arquitectura de compilación determinista para flujos de trabajo estructurados de LLM utiliza registros de nodos tipados, contratos de parámetros y validación estática para compilar grafos de flujo de trabajo con antelación. Los puntos de referencia muestran que supera a GPT-4.1 y Claude Sonnet 4.6 en profundidades de flujo de trabajo de 3 a 12+ nodos.
Uso de Claude 3.0.0: Rastreador de barra de menú de código abierto para macOS para Claude y Codex
Usage4Claude 3.0.0 añade soporte opcional para Codex, inicio de sesión integrado en el navegador para Claude, cambio entre múltiples cuentas y notificaciones localizadas.