Les données de HN confirment la baisse des partages d’articles arXiv, le pic du battage médiatique autour des LLM serait-il derrière nous ?

Dylan Castillo voulait confirmer s'il voyait moins d'articles arXiv sur la page d'accueil de Hacker News. Il a donc utilisé Claude pour effectuer une analyse rapide sur le jeu de données BigQuery HN. Les résultats montrent une tendance claire : la part des histoires arXiv sur HN a fortement diminué ces derniers mois.
Il a également examiné les pics historiques. Le premier pic en 2019 était porté par les articles sur l'apprentissage profond — 41 % des 100 articles arXiv les plus upvotés cette année-là portaient sur l'apprentissage profond. La période 2023-2026 a connu un accent encore plus marqué sur l'IA : 59 % des 100 histoires arXiv les plus upvotées concernaient les LLM ou l'IA. En 2019, les articles marquants comprenaient MuZero (161 pts), EfficientNet (119 pts), XLNet (79 pts), l'article NeurIPS sur PyTorch (113 pts) et « On the Measure of Intelligence » de Chollet (80 pts).
Pour la période 2023-2026, Castillo a demandé à Claude de deviner quels articles résisteraient à l'épreuve du temps. Les choix : DeepSeek-R1 (1 351 pts, recette ouverte pour le raisonnement de type o1 via RL), Generative Agents (391 pts, l'article « Smallville »), The Era of 1-bit LLMs / BitNet b1.58 (1 040 pts), Differential Transformer (562 pts), et le cluster LK-99 (2 408 + 1 690 pts combinés, un jalon dans la réplication en science ouverte). L'analyse complète comprend des graphiques sur la répartition des sujets et l'évolution de la part d'arXiv au fil du temps.
📖 Lire la source complète : HN LLM Tools
👀 See Also

La consommation d'eau de l'IA n'est pas un problème : analyse aux niveaux national, local et personnel
Andy Masley étudie les chiffres de la consommation d'eau des centres de données d'IA par rapport à d'autres industries et conclut qu'il s'agit d'un 'faux problème' — les recettes fiscales par gallon sont élevées et l'utilisation par personne est négligeable.

Comparaison actuelle des coûts des LLM : Deepseek, Qwen, MiniMax vs OpenAI
Une analyse Reddit montre que Deepseek-V3.2 à 0,26$/0,38$ par million de tokens est environ 10 fois moins cher que GPT-4 tout en offrant des performances de classe GPT-5 selon les benchmarks, avec Qwen3.5 et MiniMax-M2.5 comme alternatives compétitives à Claude et OpenAI.

Le filtre de politique de Claude bloque les travaux de bioinformatique impliquant des noms d'agents pathogènes.
Un chercheur en virologie computationnelle signale que le filtre de politique d'utilisation de Claude signale comme problématiques des scripts légitimes de bioinformatique lorsque des pathogènes sont nommés, nécessitant des contournements comme décrire les tâches sans nommer les organismes ou rétrograder vers Sonnet 4. Le problème affecte Claude Code, claude.ai, et les modèles Opus 4.6 et Sonnet 4.6.

Le Pentagone donne 72 heures à Anthropic pour autoriser l'utilisation militaire de l'IA Claude
Le Pentagone a lancé un ultimatum de 72 heures à Anthropic pour permettre à l'armée américaine d'utiliser son IA Claude, menaçant d'invoquer une loi de 1950 pour forcer la conformité si la startup ne se plie pas.