État des LLM Chinois : Doubao, DeepSeek & Modèles

Ceci est un résumé de la scène actuelle des LLM chinois basé sur des recherches partagées sur r/LocalLLaMA. L'analyse catégorise les principaux acteurs selon leurs modèles propriétaires, leurs offres à poids ouvert et leurs approches commerciales.

Principales entreprises et leurs modèles

ByteDance : Leur modèle propriétaire dola-seed (également appelé Doubao) est décrit comme le leader actuel du marché, jouant un rôle similaire à OpenAI. Ils ont également un modèle open source Seed OSS 36B, mais la source note qu'il ne fait pas l'objet de beaucoup de discussions.

Alibaba : Leur modèle propriétaire Qwen Max ne serait pas largement utilisé. Cependant, Alibaba est noté comme étant le plus fort dans les offres à poids ouvert, en particulier les petits modèles, et mène en capacités de texte-à-image (T2I) et texte-à-vidéo (T2V).

Tencent : Leur modèle propriétaire Hunyuan n'est pas non plus largement utilisé. Leurs efforts en T2I et T2V sont considérés comme inférieurs à ceux d'Alibaba.

Baidu : Leur modèle propriétaire Ernie n'est pas largement utilisé, Baidu étant plus fort dans la conduite autonome.

Xiaomi : Leur modèle propriétaire est Mimo V2 Pro, et ils ont un modèle à poids ouvert Mimo V2 Flash 309B-A15B.

DeepSeek : Le projet secondaire innovant

DeepSeek est décrit comme un projet secondaire d'une entreprise de trading algorithmique. L'utilisation actuelle en Chine serait proche de celle de Doubao de ByteDance, avec environ la moitié des utilisateurs. La source souligne DeepSeek comme "le plus innovant parmi toutes les entreprises de LLM chinoises", ayant inventé des techniques comme MLA, MTP, DSA et GRPO. L'analyse suggère que son modèle économique pourrait être similaire à celui des 'Six Petits Tigres de l'IA', mais spécule que le projet pourrait être davantage destiné à attirer des investissements et à obtenir un accès politique.

Les Six Petits Tigres de l'IA

Ce groupe est caractérisé par des modèles économiques très similaires : publier de grands modèles à poids ouvert pour gagner en reconnaissance tout en fournissant des services d'inférence bon marché. La source remet en question leur viabilité à long terme.

Zhipu : Introduit en bourse à Hong Kong. Leur modèle actuel GLM-5 est décrit comme un dérivé de DeepSeek.
Minimax : Introduit en bourse à Hong Kong. Ils ont un modèle propriétaire MiniMax 2.7 et un modèle à poids ouvert MiniMax 2.5, décrit comme un "MoE vanilla 229B-A10B". Cette architecture leur donnerait des coûts d'inférence significativement inférieurs aux autres.
Moonshot : Leur modèle à poids ouvert Kimi est décrit comme un dérivé de DeepSeek.
Stepfun : Leur modèle à poids ouvert Step 3.5 flash utilise un mélange de couches d'attention complète et d'attention à fenêtre glissante (SWA) dans un rapport de 1:3. Il est décrit comme un modèle 196B-A11B avec un modèle économique similaire à celui de Minimax, bien que leur modèle ne serait pas aussi bon.
Baichuan : Leur Baichuan-M3 235B est décrit comme un modèle à poids ouvert amélioré pour la médecine basé sur Qwen3Moe.
01 AI : Leur dernier modèle à poids ouvert était Yi-34B, publié en novembre 2024. Ils se concentreraient désormais sur les systèmes d'agents IA pour entreprises, les rendant "sans intérêt pour les gens ici".

📖 Read the full source: r/LocalLLaMA

État actuel des LLM chinois : Leaders du marché, modèles ouverts et modèles économiques

Principales entreprises et leurs modèles

DeepSeek : Le projet secondaire innovant

Les Six Petits Tigres de l'IA

👀 See Also

Claude Desktop v1.1.5749 Ajoute le Contrôle de l'Ordinateur et des Corrections pour les Proxys d'Entreprise

Agent IA Cursor Voyou Supprime la Base de Données de Production : Le PDG Reste Optimiste

La mise à jour automatique de Cron a cassé OpenClaw en raison d'une erreur de validation de configuration.

Deux nouveaux modèles apparaissent sur OpenRouter, probablement des variantes de DeepSeek V4.