Qwen3.5-35B-A3B-UD-Q6_K_XL Probado en Flujos de Trabajo de Desarrollo de Producción

✍️ OpenClawRadar📅 Publicado: 28 de febrero de 2026🔗 Source
Qwen3.5-35B-A3B-UD-Q6_K_XL Probado en Flujos de Trabajo de Desarrollo de Producción
Ad

Un desarrollador en r/LocalLLaMA compartió resultados detallados de pruebas del modelo Qwen3.5-35B-A3B-UD-Q6_K_XL en escenarios de desarrollo de producción. El usuario realizó tanto pruebas de referencia como aplicaciones prácticas en proyectos reales de clientes.

Puntuaciones de Referencia

El modelo logró puntuaciones de referencia de 1504pp2048 y 47.71 tg256. La velocidad de generación de tokens fue sólida cuando se distribuyó en dos GPUs, y aumentó a 80 tokens por segundo (tps) cuando se ejecutó en una sola GPU.

Metodología de Pruebas en Producción

El desarrollador probó el modelo en cinco proyectos diferentes utilizando Git Worktrees para volver a especificaciones y características conocidas. Las especificaciones para estas pruebas fueron generadas por Claude, con el desarrollador usando un plan Max Pro durante el último año.

  • Probado en proyectos de JavaScript, Go y Rust
  • Utilizó Git Worktrees para control de versiones durante las pruebas
  • La mayoría de los "errores" requerían solo ajustes de 5 minutos o podían solucionarse con un segundo prompt
  • Comparó la experiencia con usar Sonnet 4
Ad

Resultados Prácticos e Implicaciones Empresariales

El desarrollador informó que Qwen3.5 "los superó con creces" para el trabajo que realizan, destacando especialmente el fuerte rendimiento en proyectos de Go y Rust. Esto ha llevado a considerar seriamente cambiar de modelos basados en API a un enfoque híbrido: usar modelos SOTA a través de API para generación de especificaciones y revisiones, mientras se usan modelos locales para el trabajo de desarrollo.

Las pruebas han planteado preguntas sobre inversión en hardware versus costos de suscripción. El desarrollador ya ha gastado $2,000 en Claude Pro Max desde junio de 2025, con costos potenciales que podrían alcanzar $6,800 para 2027 si continúan las suscripciones. Esto ha llevado a considerar la compra de un RTX 6000 Pro como inversión empresarial.

El desarrollador había estado usando Qwen Coder para autocompletado previamente, pero encontró que Qwen3.5 lleva las capacidades de los modelos locales a un nuevo nivel para uso en producción.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también