Modelos locales Qwen 3.6 vs modelos fronterizos en una primitiva de codificación: animación de Canvas HTML en un solo archivo

Un usuario de Reddit realizó una comparación directa entre modelos cuantificados locales y modelos fronterizos basados en web para un primitivo de codificación específico: generar un único archivo HTML con una animación de canvas de página completa que muestra un automóvil de perfil conduciendo con desplazamiento de paralaje, ruedas girando e iluminación cinematográfica.
El Prompt
El prompt exacto pedía un solo archivo HTML sin bibliotecas, un canvas de página completa, animación realista de un automóvil de perfil, paisajes de paralaje en capas, ruedas girando, movimiento sutil del cuerpo, bucle suave y cielo/iluminación cohesivos.
Modelos Probados
Fronterizos (basados en web vía Perplexity, tok/s no medido):
- Claude Sonnet 4.6 Thinking (usó internet para razonar)
- Gemini 3.1 Pro Thinking
- GPT 5.4 Thinking
- Kimi k2.6 Thinking
Locales (Ryzen 5 5600, 24 GB DDR4-3200, RX 5700 XT 8GB):
- Qwen3.5 9B Q4_K_M — ~50 tok/s
- Qwen3.6-27B (Claude-opus-reasoning-distilled) Q4_K_M — 2.65 tok/s
- Qwen3.6-27B Q4_K_M — 2.70 tok/s
- Qwen3.6-31B A3B Q4_K_M — 12.13 tok/s
- Gemma-4-31b-it — 1.91 tok/s
- Qwen3.5 4B Q8 — 60 tok/s (usó internet para razonar)
- Qwen3.5 4B Q4_K_M — 80 tok/s (usó internet para razonar)
Resultados y Clasificación Subjetiva
La clasificación para esta tarea específica:
- Kimi k2.6 Thinking — resultado visual general más limpio
- Qwen3.6-27B Q4_K_M (local) — más fuerte de lo esperado; buen paralaje y sensación de carretera
- Qwen3.6-27B Claude-opus-reasoning-distilled — tercero cercano
El modelo local de 27B cuantificado produjo un movimiento y capas más naturales que algunos resultados fronterizos para este primitivo visual específico. El usuario señaló que esperaba que los modelos fronterizos superaran más claramente a los cuantificados locales.
El usuario solo cambió las etiquetas HTML <title> para rastrear qué modelo generó qué archivo. Los resultados se comparten en el hilo junto con capturas de pantalla/GIF de las animaciones en ejecución.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

Detalles del Acuerdo de Copyright de Anthropic para Desarrolladores
Anthropic resolvió una demanda colectiva por derechos de autor de $1.5 mil millones por usar obras para entrenar modelos de IA. Los titulares de derechos de autor elegibles pueden reclamar $500–$3,000 por obra validada, con fecha límite del 23 de marzo de 2026.

Resultados de Evaluación a Ciega de Gemma 4 vs Qwen 3.5 con Claude Opus como Juez
Una evaluación ciega de 30 preguntas comparó a Gemma 4 31B, Gemma 4 26B-A4B y Qwen 3.5 27B usando a Claude Opus 4.6 como juez. Qwen 3.5 27B ganó el 46.7% de los enfrentamientos, pero tuvo puntuaciones promedio más bajas debido a tres respuestas con puntuación cero.

Claude-Code v2.1.51: Correcciones de seguridad, mejoras de rendimiento y nueva función de control remoto
Claude-Code v2.1.51 agrega un subcomando de control remoto para compilaciones externas, corrige dos vulnerabilidades de seguridad en hooks, mejora el rendimiento de BashTool y reduce el uso de contexto al persistir resultados grandes de herramientas en disco a partir de 50K caracteres.

La demanda de energía en EE. UU. alcanzará máximos históricos en 2026-2027 impulsada por la IA y los centros de datos
La Administración de Información Energética de EE. UU. (EIA) pronostica un consumo récord de electricidad en 2026-2027, impulsado principalmente por el aumento de las cargas de trabajo de IA y la expansión de centros de datos.