Des chercheurs de l'U de T démontrent un ver d'IA alimentable par des modèles ouverts gratuits

Des chercheurs du laboratoire CleverHans de l'Université de Toronto ont démontré une nouvelle classe de logiciels malveillants : un ver alimenté par l'IA qui utilise des modèles d'IA open-weight accessibles au public pour adapter sa stratégie de propagation en temps réel. Dirigée par Nicolas Papernot, l'équipe a construit un prototype de preuve de concept dans un laboratoire numérique sécurisé et fermé et a publié ses résultats le 2 juin 2026. On pense que ces travaux sont les premiers à montrer que de petits modèles d'IA gratuits – et non des systèmes coûteux de pointe – peuvent alimenter des vers capables de prendre le contrôle de réseaux, de détourner des ressources de calcul et de lancer des attaques sophistiquées à un coût quasi nul.
Comment cela fonctionne
Les vers traditionnels suivent un script fixe programmé par un humain. S'ils rencontrent une défense qu'ils n'ont pas été conçus pour contourner, ils échouent. Le ver IA de Papernot brise ce schéma. Il utilise un modèle open-weight gratuit (par exemple, issu de l'écosystème croissant de modèles téléchargeables) pour évaluer chaque appareil ciblé, identifier les vulnérabilités connues et adapter sa stratégie d'attaque à la volée. Le ver se copie lui-même d'un appareil à l'autre sans intervention de l'utilisateur ni même que celui-ci s'en rende compte.
L'équipe s'est concentrée sur les modèles open-weight – des modèles dont les poids sont librement accessibles – car ils peuvent être débarrassés de leurs garde-fous de sécurité et affinés à des fins malveillantes. La communauté de la cybersécurité sous-estime souvent cette menace, partant du principe que ces petits modèles n'ont pas la puissance nécessaire pour causer des dégâts réels. Les recherches de l'U de T réfutent cette hypothèse.
Implications clés
- Pas besoin d'IA coûteuse : Le ver peut être construit avec des modèles gratuits et téléchargeables que tout le monde peut modifier.
- Adaptatif en temps réel : Contrairement aux vers scriptés, ce ver IA modifie son approche au fur et à mesure qu'il se propage, exploitant les faiblesses propres à chaque appareil.
- Large surface de ciblage : Chaque appareil en ligne – des ordinateurs portables aux systèmes CVC en passant par les contrôleurs de réseaux électriques – est une cible potentielle.
- Les défenses actuelles sont insuffisantes : Les protections existantes sont conçues pour des vers statiques et scriptés ; elles ne sont pas encore prêtes à faire face à des variantes adaptatives pilotées par l'IA.
Divulgation responsable
Avant de publier, les chercheurs ont partagé leurs résultats avec les organismes nationaux de la science, de la sécurité et de la défense afin de conseiller sur la divulgation responsable. La version publiée a été soigneusement expurgée pour supprimer toute information qui pourrait aider des acteurs malveillants. Papernot a déclaré : "La raison pour laquelle nous menons ces recherches est d'assurer la sécurité de l'écosystème numérique dont nous dépendons tous – pour protéger les gens."
Pour les développeurs et les équipes de sécurité
Ces recherches constituent un signal d'alarme précoce. Si vous travaillez dans la cybersécurité, la défense des réseaux ou la sécurité de l'IA, cet article devrait éclairer votre modèle de menace. Attendez-vous à ce que les vers augmentés par l'IA deviennent une menace pratique plus tôt que beaucoup ne le prévoient. Les travaux de l'équipe permettent à la communauté de développer des contre-mesures de manière proactive.
📖 Source : HN AI Agents
👀 See Also

CVE-2026-39861 de Claude Code : Échappement du bac à sable via suivi de lien symbolique
Une vulnérabilité de haute sévérité dans le bac à sable de Claude Code permet l'écriture arbitraire de fichiers en dehors de l'espace de travail via le suivi de liens symboliques, pouvant conduire à l'exécution de code.

L'outil Cloak remplace les mots de passe des chats par des liens autodestructeurs pour les agents OpenClaw.
Cloak est un outil open source qui remplace les mots de passe partagés dans les discussions avec les agents OpenClaw par des liens autodestructeurs. Chaque lien ne peut être ouvert qu'une seule fois, puis le mot de passe disparaît, empêchant ainsi l'accumulation de mots de passe dans les historiques de discussion.

Correction architecturale pour la sur-centralisation des agents IA : séparation de la mémoire, de l'exécution et des actions sortantes
Un développeur a réalisé que son assistant IA devenait un 'autocrate interne' en gérant la mémoire à long terme, l'accès aux outils et les décisions autonomes dans un seul composant. La solution a consisté à séparer le système en trois rôles : contrôleur privé, travailleurs à portée limitée et porte de sortie.

Les outils d'IA open source présentent des risques de sécurité via une "sécurité illusoire par la transparence".
Un post Reddit alerte sur des logiciels malveillants déguisés en agents d'IA open source et outils, où du code malveillant peut être dissimulé dans de vastes bases de code que les utilisateurs supposent sûres car elles sont sur GitHub. Le post décrit comment le 'vibe-coding' et les agents d'IA autonomes conditionnent les utilisateurs à exécuter des programmes inconnus sans vérification.