Qwen3.6-27B cabe en una única GPU de 24GB, supera al anterior modelo MoE de 397B en SWE-bench

✍️ OpenClawRadar📅 Publicado: 29 de abril de 2026🔗 Source
Qwen3.6-27B cabe en una única GPU de 24GB, supera al anterior modelo MoE de 397B en SWE-bench
Ad

Qwen3.6-27B se lanzó el 22 de abril, trayendo un modelo denso de 27B que cabe en una sola GPU de 24GB en Q4_K_M (~16.8GB) y obtiene una puntuación de 77.2 en SWE-bench Verified — superando al modelo MoE anterior de 397B (76.2). Para desarrolladores que ejecutan agentes de codificación locales en hardware de consumo, esto cambia el umbral para modelos agentivos capaces.

Especificaciones clave y arquitectura

  • Longitud de contexto de 262K
  • Licencia Apache 2.0
  • Atención lineal Gated DeltaNet (3 de 4 subcapas) con Gated Attention para el resto
  • "Thinking Preservation" transporta trazas de razonamiento entre turnos, reduciendo la generación de tokens redundantes y mejorando la eficiencia de la caché KV en sesiones largas de agentes
Ad

Requisitos de hardware

En Q4_K_M, el modelo usa ~16.8GB de VRAM, cabiendo cómodamente en una tarjeta de 24GB (por ejemplo, RTX 3090/4090, A10G). En contraste, Qwen3-Coder-Next (80B MoE, 3B activos) requiere 45–80GB en la misma cuantización, limitándolo a configuraciones de doble GPU o Apple Silicon con 48GB+ de memoria unificada.

Advertencias y detalles importantes

  • NO uses CUDA 13.2 — produce resultados basura. Quédate con CUDA 13.1 o 12.x.
  • Para usuarios que ya ejecutan Coder-Next en hardware de 48GB+ para tareas de agente, el cambio no es obviamente beneficioso.
  • Para usuarios de una sola GPU atascados con modelos de codificación locales más antiguos o débiles, Qwen3.6-27B es actualmente la opción más capaz en el nivel de 24GB.

📖 Lee la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Los usuarios informan que han cambiado de Gemini Pro a Claude Max para recibir asistencia en proyectos académicos.
Noticias

Los usuarios informan que han cambiado de Gemini Pro a Claude Max para recibir asistencia en proyectos académicos.

Un usuario cambió de Gemini Pro a Claude Max después de experimentar frustración con el rendimiento de Gemini en tareas prácticas. Informan que Claude revisó con éxito su proyecto académico, hizo preguntas aclaratorias y sugirió registrar la información aprendida en un archivo memory.md.

OpenClawRadar
Aclarando las capacidades de automatización de OpenClaw.
Noticias

Aclarando las capacidades de automatización de OpenClaw.

OpenClaw no realiza tareas completamente automatizadas de forma independiente; requiere la guía del usuario para su configuración, actuando más como un LLM tradicional.

OpenClawRadar
Lanzamiento de OpenClaw 2026.3.2: Secretos de Producción, Herramienta PDF y Configuraciones Más Seguras por Defecto
Noticias

Lanzamiento de OpenClaw 2026.3.2: Secretos de Producción, Herramienta PDF y Configuraciones Más Seguras por Defecto

OpenClaw 2026.3.2 introduce un sistema de secretos listo para producción con comportamiento de fallo rápido, una herramienta nativa de PDF con soporte para modelos de Anthropic y Google, y configuraciones más seguras que restringen el acceso a herramientas para nuevas instalaciones.

OpenClawRadar
La extensión IDE de Claude Code no se carga en Windows – Actualización de estado
Noticias

La extensión IDE de Claude Code no se carga en Windows – Actualización de estado

Una actualización de estado oficial informa que la extensión Claude Code IDE no puede cargarse en Windows a partir de 2026-05-08T22:32:19Z. Sigue el progreso y la resolución a través de la página de estado.

OpenClawRadar