Qwen3.5-35B-A3B-UD-Q6_K_XL: Rendimiento en Producción

Un desarrollador en r/LocalLLaMA compartió resultados detallados de pruebas del modelo Qwen3.5-35B-A3B-UD-Q6_K_XL en escenarios de desarrollo de producción. El usuario realizó tanto pruebas de referencia como aplicaciones prácticas en proyectos reales de clientes.

Puntuaciones de Referencia

El modelo logró puntuaciones de referencia de 1504pp2048 y 47.71 tg256. La velocidad de generación de tokens fue sólida cuando se distribuyó en dos GPUs, y aumentó a 80 tokens por segundo (tps) cuando se ejecutó en una sola GPU.

Metodología de Pruebas en Producción

El desarrollador probó el modelo en cinco proyectos diferentes utilizando Git Worktrees para volver a especificaciones y características conocidas. Las especificaciones para estas pruebas fueron generadas por Claude, con el desarrollador usando un plan Max Pro durante el último año.

Probado en proyectos de JavaScript, Go y Rust
Utilizó Git Worktrees para control de versiones durante las pruebas
La mayoría de los "errores" requerían solo ajustes de 5 minutos o podían solucionarse con un segundo prompt
Comparó la experiencia con usar Sonnet 4

Resultados Prácticos e Implicaciones Empresariales

El desarrollador informó que Qwen3.5 "los superó con creces" para el trabajo que realizan, destacando especialmente el fuerte rendimiento en proyectos de Go y Rust. Esto ha llevado a considerar seriamente cambiar de modelos basados en API a un enfoque híbrido: usar modelos SOTA a través de API para generación de especificaciones y revisiones, mientras se usan modelos locales para el trabajo de desarrollo.

Las pruebas han planteado preguntas sobre inversión en hardware versus costos de suscripción. El desarrollador ya ha gastado $2,000 en Claude Pro Max desde junio de 2025, con costos potenciales que podrían alcanzar $6,800 para 2027 si continúan las suscripciones. Esto ha llevado a considerar la compra de un RTX 6000 Pro como inversión empresarial.

El desarrollador había estado usando Qwen Coder para autocompletado previamente, pero encontró que Qwen3.5 lleva las capacidades de los modelos locales a un nuevo nivel para uso en producción.

📖 Leer la fuente completa: r/LocalLLaMA

Qwen3.5-35B-A3B-UD-Q6_K_XL Probado en Flujos de Trabajo de Desarrollo de Producción

Puntuaciones de Referencia

Metodología de Pruebas en Producción

Resultados Prácticos e Implicaciones Empresariales

👀 Ver también

Habilidad de Redacción Local de PII para OpenClaw Utiliza el Modelo GLiNER

RalphTerm: bucle estilo ralph para Claude Code con sesiones de revisión cruzada de diferentes agentes

Driftwatch V3 Lanzado: Herramienta de Monitoreo de Código Asistida por IA

NERF Plataforma de Ingeniería de Seguridad de IA de Código Abierto Ingresa en Beta Pública