GPT-5.5 Résout des Défis CTF Pwn en 1 Essai

Les compétitions Capture The Flag (CTF) ont historiquement servi de terrain d'essai pour les talents en sécurité, mais selon l'ancien top joueur kabir.au, le format ouvert des CTF est désormais bel et bien mort. La raison : les modèles d'IA de pointe qui résolvent les défis plus rapidement que les humains, avec une implication humaine minimale.

Ce qui a changé : de l'assistance à l'automatisation

Lorsque GPT-4 a été lancé, il pouvait résoudre d'un seul coup des défis CTF de difficulté moyenne — un défi de cryptographie pouvait être collé dans ChatGPT et renvoyer un flag en 10 minutes. L'impact était limité car les défis difficiles restaient intouchés. Claude Opus 4.5 a fait basculer la balance : « Presque tous les défis de difficulté moyenne, et certains défis difficiles, sont devenus solubles par un agent. » Avec Claude Code qui intègre le modèle dans une interface en ligne de commande, il est devenu trivial de construire un orchestrateur utilisant l'API CTFd pour lancer une instance Claude par défi et la laisser tourner sans surveillance pendant la première heure.

GPT-5.5 scelle l'affaire

L'auteur, qui a beaucoup travaillé avec GPT-5.5 et GPT-5.5 Pro, rapporte : « Ces modèles peuvent résoudre d'un seul coup des défis heap pwn de difficulté Insane sans fuite sur HackTheBox. » La version Pro « dépasse très probablement » Claude Mythos en capacités. La conséquence : dans un CTF de 48 heures, un agent Pro orchestré peut résoudre la majorité des défis proposés par les petits organisateurs, rendant les CTF ouverts pay-to-win — plus vous pouvez vous permettre de tokens, plus vous nettoyez le tableau rapidement.

Les classements ne mesurent plus les compétences

Le classement CTFTime reflète désormais la capacité d'orchestration et le budget, et non l'expertise en sécurité. Les équipes légendaires apparaissent moins souvent ; les créateurs de défis perdent leur motivation. L'auteur soutient que même l'argument « les débutants peuvent encore apprendre » passe à côté du sujet : le classement visible est dominé par les équipes utilisant l'IA, poussant les débutants à compter sur l'IA avant d'acquérir des instincts fondamentaux — un anti-modèle qui empêche l'apprentissage actif.

Implications pour le recrutement

Recruter via les performances aux CTF devient de moins en moins pertinent. L'orchestration d'IA pour les CTF est déjà open source ou « vibe codable », donc le rapport signal/bruit s'effondre. L'auteur, ancien membre de la meilleure équipe TheHackersCrew, conclut que la compétition est désormais un jeu truqué : « Votre performance dans un CTF ne définit plus votre compétence comme avant. »

📖 Lire la source complète : HN AI Agents