Qwen3.6-27B cabe en una única GPU de 24GB, supera al anterior modelo MoE de 397B en SWE-bench

Qwen3.6-27B se lanzó el 22 de abril, trayendo un modelo denso de 27B que cabe en una sola GPU de 24GB en Q4_K_M (~16.8GB) y obtiene una puntuación de 77.2 en SWE-bench Verified — superando al modelo MoE anterior de 397B (76.2). Para desarrolladores que ejecutan agentes de codificación locales en hardware de consumo, esto cambia el umbral para modelos agentivos capaces.
Especificaciones clave y arquitectura
- Longitud de contexto de 262K
- Licencia Apache 2.0
- Atención lineal Gated DeltaNet (3 de 4 subcapas) con Gated Attention para el resto
- "Thinking Preservation" transporta trazas de razonamiento entre turnos, reduciendo la generación de tokens redundantes y mejorando la eficiencia de la caché KV en sesiones largas de agentes
Requisitos de hardware
En Q4_K_M, el modelo usa ~16.8GB de VRAM, cabiendo cómodamente en una tarjeta de 24GB (por ejemplo, RTX 3090/4090, A10G). En contraste, Qwen3-Coder-Next (80B MoE, 3B activos) requiere 45–80GB en la misma cuantización, limitándolo a configuraciones de doble GPU o Apple Silicon con 48GB+ de memoria unificada.
Advertencias y detalles importantes
- NO uses CUDA 13.2 — produce resultados basura. Quédate con CUDA 13.1 o 12.x.
- Para usuarios que ya ejecutan Coder-Next en hardware de 48GB+ para tareas de agente, el cambio no es obviamente beneficioso.
- Para usuarios de una sola GPU atascados con modelos de codificación locales más antiguos o débiles, Qwen3.6-27B es actualmente la opción más capaz en el nivel de 24GB.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

Los usuarios informan que han cambiado de Gemini Pro a Claude Max para recibir asistencia en proyectos académicos.
Un usuario cambió de Gemini Pro a Claude Max después de experimentar frustración con el rendimiento de Gemini en tareas prácticas. Informan que Claude revisó con éxito su proyecto académico, hizo preguntas aclaratorias y sugirió registrar la información aprendida en un archivo memory.md.

Aclarando las capacidades de automatización de OpenClaw.
OpenClaw no realiza tareas completamente automatizadas de forma independiente; requiere la guía del usuario para su configuración, actuando más como un LLM tradicional.

Lanzamiento de OpenClaw 2026.3.2: Secretos de Producción, Herramienta PDF y Configuraciones Más Seguras por Defecto
OpenClaw 2026.3.2 introduce un sistema de secretos listo para producción con comportamiento de fallo rápido, una herramienta nativa de PDF con soporte para modelos de Anthropic y Google, y configuraciones más seguras que restringen el acceso a herramientas para nuevas instalaciones.

La extensión IDE de Claude Code no se carga en Windows – Actualización de estado
Una actualización de estado oficial informa que la extensión Claude Code IDE no puede cargarse en Windows a partir de 2026-05-08T22:32:19Z. Sigue el progreso y la resolución a través de la página de estado.