Réseaux de petits modèles d'IA battent les géants en rapidité, coût et précision

Andrew Trask soutient que les entreprises d'IA centralisées — Fable, Mythos, GPT, Opus — ont définitivement perdu la frontière des capacités. En utilisant des ensembles routés/pondérés de modèles moins chers, n'importe qui peut désormais dépasser la précision de n'importe quel modèle de pointe unique, à moindre coût et plus rapidement.

Principales conclusions de l'article

Capacité : Une combinaison différentiellement privée de modèles de pointe sur Humanity's Last Exam a atteint le bas des 50 — plus élevé que n'importe quel modèle unique. L'article montre un graphique où un ensemble de GPT et Opus surpasse Fable/Mythos à moitié prix.
Vitesse : Les classements de vitesse indépendants d'OpenRouter montrent que les modèles open-source sont plus rapides car les hébergeurs concurrents sur la latence.
Coût : Le moyen le moins cher d'obtenir des performances de niveau Fable/Mythos n'est plus ces modèles — c'est un ensemble de GPT-5.5 + Opus + Kimi K2.7, qui est sorti aujourd'hui et bat Fable sur les benchmarks.

Le plan d'action

Prenez n'importe quel modèle d'IA de pointe (par exemple, Fable).
Trouvez le meilleur modèle de pointe moins cher suivant (par exemple, Opus ou GPT-5.5).
Assemblez-le avec un modèle open-source leader (par exemple, Kimi K2.7) et un routeur.
Résultat : un système moins cher et plus performant — qui peut être récursé indéfiniment.

Pourquoi l'IA centralisée ne peut pas répondre : l'effet Hydre

Trask compare l'IA centralisée aux mainframes des années 1960. Une fois qu'Internet a relié les mainframes entre eux, le réseau était toujours plus fort. De même, une fois que vous pouvez assembler n'importe quelle combinaison de modèles, aucun modèle unique ne pourra jamais rattraper son retard — chaque amélioration d'un modèle unique ne fait qu'alimenter l'ensemble.

L'article déclare explicitement : « Aucun système d'IA de pointe unique n'atteindra plus jamais la frontière des capacités en raison de la façon dont les lois d'échelle/ensembles fonctionnent. » Il prédit que l'avenir est celui de « l'IA source-réseau » — des réseaux de réseaux de neurones, analogues à l'ère du PC+Internet.

📖 Lire la source complète : HN AI Agents

La course à l'IA de pointe est terminée : les réseaux de petits modèles surpassent l'IA centralisée en coût et en capacité

Principales conclusions de l'article

Le plan d'action

Pourquoi l'IA centralisée ne peut pas répondre : l'effet Hydre

👀 See Also

Glomz Octagon : Révisions de code multi-agents – 179 agents, 1 333 révisions et l'effet de réseau

Contributeur d'OpenClaw critique l'accent mis sur une parfaite fidélité visuelle au détriment de fonctionnalités modernes

L'Occident a oublié comment construire : l'effondrement de la chaîne d'approvisionnement de la défense et les leçons pour le génie logiciel

Claude d'Anthropic mène 80 000 entretiens structurés en alternative aux enquêtes