État actuel des LLM chinois : Leaders du marché, modèles ouverts et modèles économiques

Ceci est un résumé de la scène actuelle des LLM chinois basé sur des recherches partagées sur r/LocalLLaMA. L'analyse catégorise les principaux acteurs selon leurs modèles propriétaires, leurs offres à poids ouvert et leurs approches commerciales.
Principales entreprises et leurs modèles
ByteDance : Leur modèle propriétaire dola-seed (également appelé Doubao) est décrit comme le leader actuel du marché, jouant un rôle similaire à OpenAI. Ils ont également un modèle open source Seed OSS 36B, mais la source note qu'il ne fait pas l'objet de beaucoup de discussions.
Alibaba : Leur modèle propriétaire Qwen Max ne serait pas largement utilisé. Cependant, Alibaba est noté comme étant le plus fort dans les offres à poids ouvert, en particulier les petits modèles, et mène en capacités de texte-à-image (T2I) et texte-à-vidéo (T2V).
Tencent : Leur modèle propriétaire Hunyuan n'est pas non plus largement utilisé. Leurs efforts en T2I et T2V sont considérés comme inférieurs à ceux d'Alibaba.
Baidu : Leur modèle propriétaire Ernie n'est pas largement utilisé, Baidu étant plus fort dans la conduite autonome.
Xiaomi : Leur modèle propriétaire est Mimo V2 Pro, et ils ont un modèle à poids ouvert Mimo V2 Flash 309B-A15B.
DeepSeek : Le projet secondaire innovant
DeepSeek est décrit comme un projet secondaire d'une entreprise de trading algorithmique. L'utilisation actuelle en Chine serait proche de celle de Doubao de ByteDance, avec environ la moitié des utilisateurs. La source souligne DeepSeek comme "le plus innovant parmi toutes les entreprises de LLM chinoises", ayant inventé des techniques comme MLA, MTP, DSA et GRPO. L'analyse suggère que son modèle économique pourrait être similaire à celui des 'Six Petits Tigres de l'IA', mais spécule que le projet pourrait être davantage destiné à attirer des investissements et à obtenir un accès politique.
Les Six Petits Tigres de l'IA
Ce groupe est caractérisé par des modèles économiques très similaires : publier de grands modèles à poids ouvert pour gagner en reconnaissance tout en fournissant des services d'inférence bon marché. La source remet en question leur viabilité à long terme.
- Zhipu : Introduit en bourse à Hong Kong. Leur modèle actuel
GLM-5est décrit comme un dérivé de DeepSeek. - Minimax : Introduit en bourse à Hong Kong. Ils ont un modèle propriétaire
MiniMax 2.7et un modèle à poids ouvertMiniMax 2.5, décrit comme un "MoE vanilla 229B-A10B". Cette architecture leur donnerait des coûts d'inférence significativement inférieurs aux autres. - Moonshot : Leur modèle à poids ouvert
Kimiest décrit comme un dérivé de DeepSeek. - Stepfun : Leur modèle à poids ouvert
Step 3.5 flashutilise un mélange de couches d'attention complète et d'attention à fenêtre glissante (SWA) dans un rapport de 1:3. Il est décrit comme un modèle 196B-A11B avec un modèle économique similaire à celui de Minimax, bien que leur modèle ne serait pas aussi bon. - Baichuan : Leur
Baichuan-M3 235Best décrit comme un modèle à poids ouvert amélioré pour la médecine basé surQwen3Moe. - 01 AI : Leur dernier modèle à poids ouvert était
Yi-34B, publié en novembre 2024. Ils se concentreraient désormais sur les systèmes d'agents IA pour entreprises, les rendant "sans intérêt pour les gens ici".
📖 Read the full source: r/LocalLLaMA
👀 See Also

Deux nouveaux modèles apparaissent sur OpenRouter, probablement des variantes de DeepSeek V4.
Deux nouveaux modèles nommés healer-alpha et hunter-alpha sont apparus sur OpenRouter, avec des spécifications correspondant aux détails divulgués sur DeepSeek V4. Les tests initiaux montrent que les deux modèles performent bien dans les scénarios de jeu de rôle, sans filtrage des messages et avec une génération de tokens plus rapide que GLM 5.0.

OpenAI va déployer des modèles d'IA sur le réseau classifié du Département de la Guerre des États-Unis.
OpenAI a conclu un accord pour déployer ses modèles d'intelligence artificielle sur le réseau classifié du département de la Guerre des États-Unis, avec une mise en œuvre prévue pour 2026. L'article de Reuters a généré 15 points et 6 commentaires sur Hacker News.

Exécuter OpenClawd gratuitement : Succès et Défis
Dans un récent post sur r/clawdbot, un membre partage son expérience d'utilisation d'OpenClawd sans clés API, évoquant ses réussites et les défis rencontrés.

L'IA devrait élever votre réflexion, pas la remplacer — Koshy John sur la fracture cachée dans l'ingénierie
Koshy John soutient que les ingénieurs qui externalisent leur réflexion à l'IA pour des gains de productivité à court terme construisent une fondation creuse, tandis que ceux qui utilisent l'IA pour éliminer les tâches fastidieuses et opérer à un niveau supérieur créent une réelle valeur à long terme.