Hy3 LLM en tête des classements OpenRouter : Le modèle le moins cher ou autre chose ?

✍️ OpenClawRadar📅 Publié: May 30, 2026🔗 Source
Hy3 LLM en tête des classements OpenRouter : Le modèle le moins cher ou autre chose ?
Ad

Un LLM mystérieux appelé Hy3 preview a grimpé en tête du classement des modèles d'IA d'OpenRouter, battant des modèles établis comme Claude Opus 4.7 et DeepSeek V4 Flash de plus de 50 % en utilisation de tokens. Ce modèle, une version open source du géant chinois Tencent, est proposé à 0,066 $/1M tokens d'entrée sur OpenRouter, ce qui en fait le modèle majeur le moins cher de la plateforme — encore moins cher que DeepSeek V4 Flash à 0,10 $/1M tokens d'entrée.

Cependant, la qualité du modèle ne correspond pas à sa popularité. Le référentiel Hugging Face de Tencent montre des résultats de benchmark étrangement honnêtes qui ne sont pas favorables à Hy3 par rapport à d'autres modèles open source chinois. Des tests effectués par l'auteur suggèrent que la qualité du modèle est comparable à celle d'autres modèles chinois, mais loin du niveau de Claude Opus 4.7 ou GPT 5.5.

Les données d'OpenRouter révèlent plusieurs particularités :

  • Pic d'utilisation : Hy3 preview n'avait aucune utilisation avant le 8 mai 2026, date à laquelle il est passé d'une SKU gratuite à payante. L'utilisation est stable depuis, ce qui indique une adoption organique.
  • Utilisation applicative minimale : Les 5 principales applications représentent <1 % de toute l'activité de Hy3. Cela exclut qu'une seule application ait changé de modèle par défaut (comme ce fut le cas avec Grok Code Fast 1 auparavant).
  • 98 % de tokens d'entrée, 2 % de sortie — un ratio extrême suggérant une utilisation intensive dans des tâches de récupération ou de prétraitement, et non des boucles de codage agentique.
  • Fournisseur unique : Hy3 preview n'est disponible que via SiliconFlow, un fournisseur basé à Singapour, qui a connu un pic d'utilisation massif coïncidant avec Hy3.

Lorsque Hy3 est passé de gratuit à payant, l'utilisation n'a pas chuté de façon significative, ce qui suggère que les utilisateurs sont prêts à payer malgré la qualité inférieure du modèle — probablement parce qu'il reste l'option la moins chère sur OpenRouter. L'auteur se demande : Hy3 preview est-il vraiment le LLM le moins cher soutenu par une grande entreprise sur OpenRouter ?

Ad

Les développeurs utilisant des agents de codage IA doivent être conscients que les économies de coûts peuvent se faire au détriment de la qualité. Si vous effectuez des inférences à volume élevé où la qualité de sortie est moins critique (par exemple, extraction de données, classification simple), Hy3 pourrait être une option viable. Mais pour le codage agentique complexe, attendez-vous à des résultats nettement moins bons qu'avec Claude ou GPT.

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

Microsoft annule les licences de Claude Code — les agents IA trop coûteux à déployer
News

Microsoft annule les licences de Claude Code — les agents IA trop coûteux à déployer

Microsoft annule la plupart des licences Claude Code, redirigeant ses ingénieurs vers GitHub Copilot CLI. Uber a épuisé son budget IA 2026 en quatre mois. Le coût par tâche pourrait augmenter malgré des tokens moins chers.

OpenClawRadar
Des chercheurs de Cambridge développent un memristor à oxyde d'hafnium pour des puces IA à faible consommation
News

Des chercheurs de Cambridge développent un memristor à oxyde d'hafnium pour des puces IA à faible consommation

Des chercheurs de l'Université de Cambridge ont créé un mémristor à base d'oxyde d'hafnium qui commute des courants un million de fois plus faibles que les dispositifs à oxyde conventionnels, réduisant potentiellement la consommation énergétique du matériel d'IA jusqu'à 70 %.

OpenClawRadar
Utilisateur de Reddit Soutient que les Développeurs Devraient Passer du Code Propre à l'Architecture de Modèles avec des Agents IA
News

Utilisateur de Reddit Soutient que les Développeurs Devraient Passer du Code Propre à l'Architecture de Modèles avec des Agents IA

Un post sur Reddit soutient que les développeurs utilisant des agents d'IA comme Claude devraient arrêter de se concentrer sur l'écriture de code propre et devenir plutôt des 'architectes de modèles' qui orchestrent des systèmes d'IA. L'auteur partage des techniques spécifiques, notamment la création de 'cartes logiques' avant le codage et le traitement des prompts comme des revues de conception.

OpenClawRadar
Les résidents du Maryland frappés par une mise à niveau du réseau de 2 milliards de dollars pour les centres de données d'IA hors de l'État — l'État dépose une plainte auprès de la FERC
News

Les résidents du Maryland frappés par une mise à niveau du réseau de 2 milliards de dollars pour les centres de données d'IA hors de l'État — l'État dépose une plainte auprès de la FERC

Le bureau de l'avocat des contribuables du Maryland a déposé une plainte auprès de la FERC contre PJM Interconnection, qui a imputé 2 milliards de dollars sur un total de 22 milliards de dollars de mises à niveau du réseau électrique aux clients du Maryland — coûtant environ 345 $ par résident, principalement pour bénéficier à des centres de données d'IA situés hors de l'État.

OpenClawRadar