La course à l'IA de pointe est terminée : les réseaux de petits modèles surpassent l'IA centralisée en coût et en capacité

Andrew Trask soutient que les entreprises d'IA centralisées — Fable, Mythos, GPT, Opus — ont définitivement perdu la frontière des capacités. En utilisant des ensembles routés/pondérés de modèles moins chers, n'importe qui peut désormais dépasser la précision de n'importe quel modèle de pointe unique, à moindre coût et plus rapidement.
Principales conclusions de l'article
- Capacité : Une combinaison différentiellement privée de modèles de pointe sur Humanity's Last Exam a atteint le bas des 50 — plus élevé que n'importe quel modèle unique. L'article montre un graphique où un ensemble de GPT et Opus surpasse Fable/Mythos à moitié prix.
- Vitesse : Les classements de vitesse indépendants d'OpenRouter montrent que les modèles open-source sont plus rapides car les hébergeurs concurrents sur la latence.
- Coût : Le moyen le moins cher d'obtenir des performances de niveau Fable/Mythos n'est plus ces modèles — c'est un ensemble de GPT-5.5 + Opus + Kimi K2.7, qui est sorti aujourd'hui et bat Fable sur les benchmarks.
Le plan d'action
- Prenez n'importe quel modèle d'IA de pointe (par exemple, Fable).
- Trouvez le meilleur modèle de pointe moins cher suivant (par exemple, Opus ou GPT-5.5).
- Assemblez-le avec un modèle open-source leader (par exemple, Kimi K2.7) et un routeur.
- Résultat : un système moins cher et plus performant — qui peut être récursé indéfiniment.
Pourquoi l'IA centralisée ne peut pas répondre : l'effet Hydre
Trask compare l'IA centralisée aux mainframes des années 1960. Une fois qu'Internet a relié les mainframes entre eux, le réseau était toujours plus fort. De même, une fois que vous pouvez assembler n'importe quelle combinaison de modèles, aucun modèle unique ne pourra jamais rattraper son retard — chaque amélioration d'un modèle unique ne fait qu'alimenter l'ensemble.
L'article déclare explicitement : « Aucun système d'IA de pointe unique n'atteindra plus jamais la frontière des capacités en raison de la façon dont les lois d'échelle/ensembles fonctionnent. » Il prédit que l'avenir est celui de « l'IA source-réseau » — des réseaux de réseaux de neurones, analogues à l'ère du PC+Internet.
📖 Lire la source complète : HN AI Agents
👀 See Also

Glomz Octagon : Révisions de code multi-agents – 179 agents, 1 333 révisions et l'effet de réseau
Glomz.com a mené une expérience où 179 agents IA se sont inscrits, ont soumis 433 soumissions de code et généré 1 333 révisions dans une arène « Octagon ». L'effet de réseau « cascade de révisions » est réel — les soumissions avec 3 à 5 révisions initiales ont attiré plus d'agents, la meilleure soumission recevant 21 révisions.

Contributeur d'OpenClaw critique l'accent mis sur une parfaite fidélité visuelle au détriment de fonctionnalités modernes
Un post Reddit sur r/openclaw détaille comment une PR d'un contributeur visant à résoudre les problèmes de mise à l'échelle de la résolution et à ajouter la prise en charge des taux de rafraîchissement élevés a été rejetée car elle s'écartait des contraintes visuelles du moteur d'origine, déclenchant un débat sur l'orientation du projet.

L'Occident a oublié comment construire : l'effondrement de la chaîne d'approvisionnement de la défense et les leçons pour le génie logiciel
Raytheon a dû rappeler des ingénieurs à la retraite pour relancer la production de missiles Stinger à partir de schémas vieux de 40 ans. Le même schéma se reproduit aujourd'hui dans le logiciel, où des décennies d'optimisation des coûts ont atrophié le vivier de talents et les connaissances institutionnelles.

Claude d'Anthropic mène 80 000 entretiens structurés en alternative aux enquêtes
Anthropic a utilisé Claude pour mener des entretiens structurés avec environ 80 000 utilisateurs dans plus de 150 pays et 70 langues, le LLM servant à la fois d'intervieweur et d'analyste pour recueillir des informations conversationnelles.