Qwen3.5-35B-A3B-UD-Q6_K_XL Probado en Flujos de Trabajo de Desarrollo de Producción

Un desarrollador en r/LocalLLaMA compartió resultados detallados de pruebas del modelo Qwen3.5-35B-A3B-UD-Q6_K_XL en escenarios de desarrollo de producción. El usuario realizó tanto pruebas de referencia como aplicaciones prácticas en proyectos reales de clientes.
Puntuaciones de Referencia
El modelo logró puntuaciones de referencia de 1504pp2048 y 47.71 tg256. La velocidad de generación de tokens fue sólida cuando se distribuyó en dos GPUs, y aumentó a 80 tokens por segundo (tps) cuando se ejecutó en una sola GPU.
Metodología de Pruebas en Producción
El desarrollador probó el modelo en cinco proyectos diferentes utilizando Git Worktrees para volver a especificaciones y características conocidas. Las especificaciones para estas pruebas fueron generadas por Claude, con el desarrollador usando un plan Max Pro durante el último año.
- Probado en proyectos de JavaScript, Go y Rust
- Utilizó Git Worktrees para control de versiones durante las pruebas
- La mayoría de los "errores" requerían solo ajustes de 5 minutos o podían solucionarse con un segundo prompt
- Comparó la experiencia con usar Sonnet 4
Resultados Prácticos e Implicaciones Empresariales
El desarrollador informó que Qwen3.5 "los superó con creces" para el trabajo que realizan, destacando especialmente el fuerte rendimiento en proyectos de Go y Rust. Esto ha llevado a considerar seriamente cambiar de modelos basados en API a un enfoque híbrido: usar modelos SOTA a través de API para generación de especificaciones y revisiones, mientras se usan modelos locales para el trabajo de desarrollo.
Las pruebas han planteado preguntas sobre inversión en hardware versus costos de suscripción. El desarrollador ya ha gastado $2,000 en Claude Pro Max desde junio de 2025, con costos potenciales que podrían alcanzar $6,800 para 2027 si continúan las suscripciones. Esto ha llevado a considerar la compra de un RTX 6000 Pro como inversión empresarial.
El desarrollador había estado usando Qwen Coder para autocompletado previamente, pero encontró que Qwen3.5 lleva las capacidades de los modelos locales a un nuevo nivel para uso en producción.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Reemplazar Kafka, Redis y RabbitMQ con NATS: La experiencia de un desarrollador
Un desarrollador reemplazó Kafka, Redis y RabbitMQ con NATS en su arquitectura, compartiendo detalles específicos de implementación y lecciones aprendidas al consolidar múltiples sistemas de mensajería en una sola herramienta.

Prueba de LLMs locales para generación autónoma de código: Benchmark de calidad vs. velocidad
Un desarrollador creó un arnés para probar LLMs locales en tareas reales de generación de código Go, midiendo el éxito de compilación, la precisión en la extracción de campos y el rendimiento. Los resultados comparan modelos en calidad y velocidad.
Uso de Claude 3.0.0: Rastreador de barra de menú de código abierto para macOS para Claude y Codex
Usage4Claude 3.0.0 añade soporte opcional para Codex, inicio de sesión integrado en el navegador para Claude, cambio entre múltiples cuentas y notificaciones localizadas.

Corrección de la inflación de contexto en la memoria automática de Claude Code con un esquema de nombres y script de auditoría
Una habilidad de Claude Code impone un esquema de nomenclatura de 3 tipos, metadatos obligatorios y un script de auditoría en bash para deduplicar archivos de memoria y reducir la carga de contexto.