Estado Actual de los LLM Chinos: Líderes del Mercado, Modelos Abiertos y Modelos de Negocio

Este es un resumen de la escena actual de los LLM chinos basado en una investigación compartida en r/LocalLLaMA. El análisis categoriza a los principales actores por sus modelos propietarios, ofertas de pesos abiertos y enfoques comerciales.
Principales empresas y sus modelos
ByteDance: Su modelo propietario dola-seed (también llamado Doubao) se describe como el actual líder del mercado, desempeñando un papel similar al de OpenAI. También tienen un modelo de código abierto Seed OSS 36B, pero la fuente señala que no genera mucha discusión.
Alibaba: Su modelo propietario Qwen Max supuestamente no se usa ampliamente. Sin embargo, Alibaba destaca por ser el más fuerte en ofertas de pesos abiertos, especialmente en modelos pequeños, y lidera en capacidades de texto a imagen (T2I) y texto a video (T2V).
Tencent: Su modelo propietario Hunyuan tampoco se usa ampliamente. Sus esfuerzos en T2I y T2V se consideran inferiores a los de Alibaba.
Baidu: Su modelo propietario Ernie no se usa ampliamente, siendo Baidu más fuerte en conducción autónoma.
Xiaomi: Su modelo propietario es Mimo V2 Pro, y tienen un modelo de pesos abiertos Mimo V2 Flash 309B-A15B.
DeepSeek: El proyecto secundario innovador
DeepSeek se describe como un proyecto secundario de una empresa de trading algorítmico. Su uso actual en China supuestamente es un cercano segundo lugar después de Doubao de ByteDance, con aproximadamente la mitad de los usuarios. La fuente destaca a DeepSeek como "el más innovador entre todas las empresas chinas de LLM", habiendo inventado técnicas como MLA, MTP, DSA y GRPO. El análisis sugiere que su modelo de negocio podría ser similar al de los 'Seis Tigres Pequeños de IA', pero especula que el proyecto podría ser más para atraer inversiones y ganar acceso político.
Los Seis Tigres Pequeños de IA
Este grupo se caracteriza por modelos de negocio muy similares: lanzan grandes modelos de pesos abiertos para ganar reconocimiento mientras ofrecen servicios de inferencia baratos. La fuente cuestiona su viabilidad a largo plazo.
- Zhipu: Cotizó en Hong Kong. Su modelo actual
GLM-5se describe como un derivado de DeepSeek. - Minimax: Cotizó en Hong Kong. Tienen un modelo propietario
MiniMax 2.7y un modelo de pesos abiertosMiniMax 2.5, descrito como un "MoE vainilla 229B-A10B". Esta arquitectura supuestamente les da costos de inferencia significativamente más bajos que otros. - Moonshot: Su modelo de pesos abiertos
Kimise describe como un derivado de DeepSeek. - Stepfun: Su modelo de pesos abiertos
Step 3.5 flashusa una mezcla de capas de atención completa y atención de ventana deslizante (SWA) en una proporción de 1:3. Se describe como un modelo 196B-A11B con un modelo de negocio similar al de Minimax, aunque su modelo supuestamente no es tan bueno. - Baichuan: Su
Baichuan-M3 235Bse describe como un modelo de pesos abiertos mejorado para medicina basado enQwen3Moe. - 01 AI: Su último modelo de pesos abiertos fue
Yi-34B, publicado en noviembre de 2024. Ahora supuestamente se centran en sistemas de agentes de IA empresariales, lo que los hace "irrelevantes para la gente aquí".
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Claude 4.6 Pensamiento Adaptativo: Usuario de Reddit Informa Desperdicio de Tokens y Proporciona Comandos de Desactivación
Un usuario de Reddit informa que la nueva función de pensamiento adaptativo de Claude 4.6 puede desperdiciar tokens y agregar latencia en Claude Code, proporcionando comandos de shell para desactivarla o limitar los tokens de pensamiento.

Configuración de Subagentes en OpenClaw: Consideraciones Clave
Los usuarios que experimentan con OpenClaw enfrentan problemas al configurar subagentes, especialmente al modificar archivos JSON.

RTX 5000 PRO 48GB ofrece 4400 tok/s de almacenamiento en caché de precisión para Qwen3.6-27B
Un constructor de PC por primera vez reporta 4400 tok/s de procesamiento de prompt y 80 tok/s de generación con Qwen3.6-27B-FP8, caché KV de precisión completa en una sola RTX 5000 Pro 48GB, usando vLLM y Claude Code.

La zombificación de las universidades por la IA: un relato en primera persona del engaño con LLM en colegios de élite
Un análisis de cómo los LLM están destruyendo sistemáticamente la integridad académica en universidades de élite, con ejemplos específicos de UChicago: brechas de 40 puntos entre exámenes para llevar a casa y presenciales, estudiantes fotografiando exámenes durante las pruebas y profesores redactando clases con ChatGPT.