Modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2 Lanzado con Configuración de LM Studio

✍️ OpenClawRadar📅 Publicado: 19 de abril de 2026🔗 Source

Detalles del Modelo y Disponibilidad

El modelo Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-Q4_K_M-GGUF ya está disponible en HuggingFace. Este modelo fue creado fusionando dos modelos existentes: Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF de Jackrong y Qwen3.5-9B-Uncensored-HauhauCS-Aggressive de HauhauCS.

La fusión preserva todos los datos de entrenamiento y mantiene la precisión en la arquitectura Qwen 3.5 9B utilizando precisión Float32 durante el proceso de fusión. El modelo está entrenado en el conjunto de datos Claude Opus 4.6 disponible en https://huggingface.co/datasets/Roman1111111/claude-opus-4.6-10000x.

Configuración Recomendada

Para el mejor rendimiento en LM Studio 0.4.7 (compilación 4), utiliza estas configuraciones:

Prompt del Sistema: https://pastebin.com/pU25DVnB
Temperatura: 0.7
Muestreo Top K: 20
Penalización de Repetición: (desactivada) o 1.0
Penalización de Presencia: 1.5
Muestreo Top P: 0.8
Muestreo Min P: 0.0
Semilla: 3407

Rendimiento y Hardware

En una RTX 3060, el modelo alcanza 42 tokens por segundo en LM Studio. El creador señala que puede ejecutarse aún más rápido en llama-server. El modelo fue creado en respuesta a solicitudes de usuarios en Reddit y HuggingFace que deseaban una ventana de contexto grande en IA local inteligente sin censura sin requerir GPUs potentes.

El modelo está disponible en: https://huggingface.co/LuffyTheFox/Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2-GGUF

📖 Leer la fuente completa: r/LocalLLaMA

👀 Ver también

Herramientas

Codesight: El Motor de Contexto de IA Reduce 30K-60K Tokens en las Sesiones de Código de Claude

Codesight es una herramienta de código abierto que analiza bases de código para proporcionar a los agentes de IA de programación un contexto estructurado, reduciendo el desperdicio de tokens. Un desarrollador colaboró con el mantenedor para agregar análisis AST para Next.js y Prisma, una suite de evaluación, telemetría de tokens y perfiles para Claude Code y Cursor.

15 abr 2026, 13:45 UTC

OpenClawRadar

Herramientas

Resumen comparativo de la inferencia rápida de LLM por Anthropic y OpenAI.

Anthropic y OpenAI han lanzado características distintas de 'modo rápido' para una inferencia más rápida de LLM, aprovechando OpenAI los chips de Cerebras para mayor velocidad.

15 feb 2026, 13:45 UTC

OpenClawRadar

Herramientas

La habilidad OpenClaw reduce los tokens del árbol de accesibilidad de 600K a 1.3K para sitios con muchos anuncios.

Un desarrollador creó una habilidad de OpenClaw que utiliza clasificación de elementos basada en ML para podar árboles de accesibilidad, reduciendo slickdeals.com de ~598K tokens a ~1.3K tokens al mantener solo los ~50 elementos accionables principales.

26 feb 2026, 05:45 UTC

OpenClawRadar

Herramientas

AgentTransfer: Herramienta de Código Abierto Permite que los Agentes OpenClaw se Envíen Archivos por Correo Electrónico

AgentTransfer es un servidor open-source de un solo binario que asigna a cada agente de IA una dirección de correo electrónico y una carpeta, permitiendo compartir archivos entre instancias de OpenClaw mediante MCP. Soporta carga, envío, bandeja de entrada con long-poll y descarga con verificación SHA256.

13 jul 2026, 12:18 UTC

OpenClawRadar