Comparación de referencia de Qwen3.6 Plus con modelos SOTA occidentales

✍️ OpenClawRadar📅 Publicado: 5 de abril de 2026🔗 Source
Comparación de referencia de Qwen3.6 Plus con modelos SOTA occidentales
Ad

Una publicación en Reddit en r/LocalLLaMA compara Qwen3.6 Plus con varios modelos occidentales de última generación en múltiples benchmarks. La comparación incluye métricas de rendimiento específicas para cada modelo.

Resultados de los Benchmarks

La fuente proporciona estas puntuaciones exactas:

  • Qwen3.6-Plus: SWE-bench Verified 78.8, GPQA / GPQA Diamond 90.4, HLE (sin herramientas) 28.8, MMMU-Pro 78.8
  • GPT‑5.4 (xhigh): SWE-bench Verified 78.2, GPQA / GPQA Diamond 93.0, HLE (sin herramientas) 39.8, MMMU-Pro 81.2
  • Claude Opus 4.6 (thinking heavy): SWE-bench Verified 80.8, GPQA / GPQA Diamond 91.3, HLE (sin herramientas) 34.44, MMMU-Pro 77.3
  • Gemini 3.1 Pro Preview: SWE-bench Verified 80.6, GPQA / GPQA Diamond 94.3, HLE (sin herramientas) 44.7, MMMU-Pro 80.5

La publicación incluye un gráfico de comparación visual disponible en: https://preview.redd.it/6kq4tt07yrsg1.png?width=714&format=png&auto=webp&s=ad8b207fb13729ae84f5b74cec5fd84a81dcface

Ad

Evaluación del Usuario

El autor original señala que Qwen3.6 Plus es "competitivo pero no el mejor" y afirma: "Será mi nuevo modelo dado lo económico que es, pero si realmente es bueno en la vida real dependerá de más que solo benchmarks". También observa que "Opus destruye a todos los demás a pesar de ser 3º o 4º en artificalanalysis".

📖 Read the full source: r/LocalLLaMA

Ad

👀 Ver también

Anthropic lanza 10 agentes de IA financiera para presentaciones, KYC y cierre de fin de mes
Noticias

Anthropic lanza 10 agentes de IA financiera para presentaciones, KYC y cierre de fin de mes

Anthropic lanzó 10 agentes de IA listos para usar para servicios financieros y seguros, que cubren la creación de pitchbooks, verificación KYC y cierre de fin de mes, entregados a través de Claude Cowork, Claude Code y Managed Agents.

OpenClawRadar
El Sam Altman de OpenAI apoya las líneas rojas del Pentágono de Anthropic y propone salvaguardas técnicas.
Noticias

El Sam Altman de OpenAI apoya las líneas rojas del Pentágono de Anthropic y propone salvaguardas técnicas.

Sam Altman, CEO de OpenAI, ha expresado su apoyo a la postura ética de Anthropic contra el uso de la IA del Pentágono para vigilancia masiva y armas autónomas, mientras propone salvaguardas técnicas como el despliegue exclusivo en la nube como solución.

OpenClawRadar
Vendor Lock-In de IA se Intensifica: Cambiar de Modelos Ahora Cuesta Más de lo que la Mayoría Esperaba
Noticias

Vendor Lock-In de IA se Intensifica: Cambiar de Modelos Ahora Cuesta Más de lo que la Mayoría Esperaba

Una encuesta de Zapier a 542 ejecutivos estadounidenses muestra que el 90% creía que podía cambiar de proveedor de IA en menos de 4 semanas, pero el 58% de las migraciones reales fracasaron o llevaron mucho más tiempo. Mientras tanto, OpenAI aumentó el precio de los tokens de entrada de GPT-5.2 de $1.25 a $5.75, y Anthropic cambió Claude Enterprise a precios dinámicos, lo que podría duplicar o triplicar los costos para los usuarios intensivos.

OpenClawRadar
Claude Code agrega ejecución programada de tareas para flujos de trabajo automatizados
Noticias

Claude Code agrega ejecución programada de tareas para flujos de trabajo automatizados

Anthropic ha habilitado la ejecución programada para Claude Code, permitiendo a los desarrolladores configurar tareas una vez y que se ejecuten automáticamente sin necesidad de indicaciones manuales. La función admite revisiones diarias de commits, auditorías de dependencias, escaneos de registros de errores y revisiones de PR.

OpenClawRadar