Comparación de referencia de Qwen3.6 Plus con modelos SOTA occidentales

✍️ OpenClawRadar📅 Publicado: 5 de abril de 2026🔗 Source

Una publicación en Reddit en r/LocalLLaMA compara Qwen3.6 Plus con varios modelos occidentales de última generación en múltiples benchmarks. La comparación incluye métricas de rendimiento específicas para cada modelo.

Resultados de los Benchmarks

La fuente proporciona estas puntuaciones exactas:

Qwen3.6-Plus: SWE-bench Verified 78.8, GPQA / GPQA Diamond 90.4, HLE (sin herramientas) 28.8, MMMU-Pro 78.8
GPT‑5.4 (xhigh): SWE-bench Verified 78.2, GPQA / GPQA Diamond 93.0, HLE (sin herramientas) 39.8, MMMU-Pro 81.2
Claude Opus 4.6 (thinking heavy): SWE-bench Verified 80.8, GPQA / GPQA Diamond 91.3, HLE (sin herramientas) 34.44, MMMU-Pro 77.3
Gemini 3.1 Pro Preview: SWE-bench Verified 80.6, GPQA / GPQA Diamond 94.3, HLE (sin herramientas) 44.7, MMMU-Pro 80.5

La publicación incluye un gráfico de comparación visual disponible en: https://preview.redd.it/6kq4tt07yrsg1.png?width=714&format=png&auto=webp&s=ad8b207fb13729ae84f5b74cec5fd84a81dcface

Evaluación del Usuario

El autor original señala que Qwen3.6 Plus es "competitivo pero no el mejor" y afirma: "Será mi nuevo modelo dado lo económico que es, pero si realmente es bueno en la vida real dependerá de más que solo benchmarks". También observa que "Opus destruye a todos los demás a pesar de ser 3º o 4º en artificalanalysis".

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Noticias

Sociedad Sintética: Agentes de IA Construyendo Vidas Virtuales en Moltbook

7 feb 2026, 15:58 UTC

r/moltbot community

Noticias

La extensión IDE de Claude Code no se carga en Windows – Actualización de estado

Una actualización de estado oficial informa que la extensión Claude Code IDE no puede cargarse en Windows a partir de 2026-05-08T22:32:19Z. Sigue el progreso y la resolución a través de la página de estado.

9 may 2026, 00:18 UTC

OpenClawRadar

Noticias

Riesgos de Litigación en las Estructuras de Financiamiento de Centros de Datos de IA

La expansión de los centros de datos de IA requiere una inversión en infraestructura de 5,2 billones de dólares para 2030, con empresas que utilizan estructuras de financiación complejas como vehículos de propósito específico (SPV) e instalaciones con garantía de GPU, lo que genera nueve categorías de riesgo de litigio.

1 abr 2026, 01:45 UTC

OpenClawRadar

Noticias

Contenedores Docker: El caso en contra de los trabajos cron

Una discusión en r/openclaw destaca el tema controversial del uso de trabajos cron dentro de contenedores Docker. Si bien la automatización fácil puede ser un atractivo inmediato, la comunidad desaconseja su uso.

11 feb 2026, 15:45 UTC

OpenClawRadar