LLM Chinos 2024: Líderes, Modelos Abiertos y Negocios

Este es un resumen de la escena actual de los LLM chinos basado en una investigación compartida en r/LocalLLaMA. El análisis categoriza a los principales actores por sus modelos propietarios, ofertas de pesos abiertos y enfoques comerciales.

Principales empresas y sus modelos

ByteDance: Su modelo propietario dola-seed (también llamado Doubao) se describe como el actual líder del mercado, desempeñando un papel similar al de OpenAI. También tienen un modelo de código abierto Seed OSS 36B, pero la fuente señala que no genera mucha discusión.

Alibaba: Su modelo propietario Qwen Max supuestamente no se usa ampliamente. Sin embargo, Alibaba destaca por ser el más fuerte en ofertas de pesos abiertos, especialmente en modelos pequeños, y lidera en capacidades de texto a imagen (T2I) y texto a video (T2V).

Tencent: Su modelo propietario Hunyuan tampoco se usa ampliamente. Sus esfuerzos en T2I y T2V se consideran inferiores a los de Alibaba.

Baidu: Su modelo propietario Ernie no se usa ampliamente, siendo Baidu más fuerte en conducción autónoma.

Xiaomi: Su modelo propietario es Mimo V2 Pro, y tienen un modelo de pesos abiertos Mimo V2 Flash 309B-A15B.

DeepSeek: El proyecto secundario innovador

DeepSeek se describe como un proyecto secundario de una empresa de trading algorítmico. Su uso actual en China supuestamente es un cercano segundo lugar después de Doubao de ByteDance, con aproximadamente la mitad de los usuarios. La fuente destaca a DeepSeek como "el más innovador entre todas las empresas chinas de LLM", habiendo inventado técnicas como MLA, MTP, DSA y GRPO. El análisis sugiere que su modelo de negocio podría ser similar al de los 'Seis Tigres Pequeños de IA', pero especula que el proyecto podría ser más para atraer inversiones y ganar acceso político.

Los Seis Tigres Pequeños de IA

Este grupo se caracteriza por modelos de negocio muy similares: lanzan grandes modelos de pesos abiertos para ganar reconocimiento mientras ofrecen servicios de inferencia baratos. La fuente cuestiona su viabilidad a largo plazo.

Zhipu: Cotizó en Hong Kong. Su modelo actual GLM-5 se describe como un derivado de DeepSeek.
Minimax: Cotizó en Hong Kong. Tienen un modelo propietario MiniMax 2.7 y un modelo de pesos abiertos MiniMax 2.5, descrito como un "MoE vainilla 229B-A10B". Esta arquitectura supuestamente les da costos de inferencia significativamente más bajos que otros.
Moonshot: Su modelo de pesos abiertos Kimi se describe como un derivado de DeepSeek.
Stepfun: Su modelo de pesos abiertos Step 3.5 flash usa una mezcla de capas de atención completa y atención de ventana deslizante (SWA) en una proporción de 1:3. Se describe como un modelo 196B-A11B con un modelo de negocio similar al de Minimax, aunque su modelo supuestamente no es tan bueno.
Baichuan: Su Baichuan-M3 235B se describe como un modelo de pesos abiertos mejorado para medicina basado en Qwen3Moe.
01 AI: Su último modelo de pesos abiertos fue Yi-34B, publicado en noviembre de 2024. Ahora supuestamente se centran en sistemas de agentes de IA empresariales, lo que los hace "irrelevantes para la gente aquí".

📖 Read the full source: r/LocalLLaMA

Estado Actual de los LLM Chinos: Líderes del Mercado, Modelos Abiertos y Modelos de Negocio

Principales empresas y sus modelos

DeepSeek: El proyecto secundario innovador

Los Seis Tigres Pequeños de IA

👀 Ver también

Costos por Hora en el Mundo Real para Equipos de Agentes de IA de Larga Duración

OpenClaw v2026.6.11: Correcciones para respuestas mal ubicadas, envíos bloqueados y fallos del modelo

Lo que falta en la narrativa "agentiva": un rol de usuario agente bien definido

Claude Sonnet 4.6 Revelado: Capacidades Mejoradas de Codificación y Uso de Computadoras