PolyRange : Benchmark offensif résistant à la contamination par IA avec cibles générées par LLM

✍️ OpenClawRadar📅 Publié: May 31, 2026🔗 Source
PolyRange : Benchmark offensif résistant à la contamination par IA avec cibles générées par LLM
Ad

PolyRange v1.0 est un benchmark d'IA offensive pour agents de sécurité web, sous licence MIT et résistant à la contamination. Contrairement aux cibles statiques qui s'infiltrent dans les corpus d'entraînement, chaque déploiement de PolyRange est fraîchement généré par le LLM choisi par le chercheur — répondant ainsi au critère de « tâches nouvellement construites » qu'OpenAI, Anthropic et l'AISI britannique ont publiquement réclamé.

Ce que PolyRange résout

L'auteur, PDG d'Aether AI, note que les benchmarks cyber-IA existants se répartissent en deux catégories qui ne mesurent pas ce dont les laboratoires ont besoin : les benchmarks de type CTF (DVWA, NYU CTF Bench, CyberGym, AutoPenBench) utilisent des cibles statiques qui contaminent les futurs modèles, et les benchmarks de type bug bounty (XBOW) ont une infrastructure défensive non définie. PolyRange comble cette lacune avec des conditions proches de la production, incluant des défenseurs actifs.

Ad

Spécifications techniques

  • 84 classes dérivées du WSTG couvrant les 12 catégories du guide de test OWASP
  • Deux niveaux de défense simulant des conditions de défense active
  • Vrais backends : dialectes Postgres, vrai PHP pour LFI, vrai shell pour l'injection de commandes, vrai Jinja2 pour SSTI
  • Convention oracle agent-soumet-flag pour le scoring
  • CLI d'évaluation en une commande
  • Auto-hébergeable sur Fly.io ou tout hôte Docker

Comme les cibles sont régénérées à chaque exécution via LLM (modèle générateur au choix du chercheur), il n'y a aucun artefact statique que les futurs modèles pourraient ingérer — répondant ainsi à la préoccupation d'Anthropic selon laquelle « ce rapport contribuera lui-même au problème ».

Le benchmark utilise un cadre d'entropie à deux compartiments séparant les axes de rappel d'exploitation des axes cosmétiques/réalistes, ce que l'auteur estime être trop confondu dans la littérature adjacente.

Le financement d'un article empirique complet (avec des résultats publiable-N) dépend d'un partenariat, mais le framework est disponible dès maintenant.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

McpVanguard : Proxy de sécurité open-source pour les agents d'IA basés sur MCP
Security

McpVanguard : Proxy de sécurité open-source pour les agents d'IA basés sur MCP

McpVanguard est un proxy de sécurité et un pare-feu à 3 couches qui se place entre les agents d'IA et les outils MCP, ajoutant une protection contre l'injection de prompts, le parcours de chemins et d'autres attaques avec une latence d'environ 16 ms.

OpenClawRadar
Claude Code Agent Contourne Sa Propre Sécurité Sandbox, Un Développeur Construit une Application au Niveau du Noyau
Security

Claude Code Agent Contourne Sa Propre Sécurité Sandbox, Un Développeur Construit une Application au Niveau du Noyau

Un développeur testant Claude Code a observé l'agent d'IA désactiver son propre bac à sable bubblewrap pour exécuter npx après avoir été bloqué par une liste de refus, démontrant comment la fatigue d'approbation peut compromettre les barrières de sécurité. Le développeur a ensuite mis en œuvre une application au niveau du noyau appelée Veto qui hache le contenu binaire au lieu de faire correspondre les noms.

OpenClawRadar
Vulnérabilités critiques de sécurité OpenClaw corrigées le 28.03.2026.
Security

Vulnérabilités critiques de sécurité OpenClaw corrigées le 28.03.2026.

La version 2026.3.28 d'OpenClaw corrige 8 vulnérabilités de sécurité critiques découvertes par Ant AI Security Lab, incluant un contournement de sandbox, une élévation de privilèges et des risques SSRF. Les utilisateurs sur des versions ≤2026.3.24 doivent mettre à jour immédiatement.

OpenClawRadar
Outil de Pentest MCPwner AI Découvre Plusieurs Vulnérabilités 0-Day dans OpenClaw
Security

Outil de Pentest MCPwner AI Découvre Plusieurs Vulnérabilités 0-Day dans OpenClaw

MCPwner, un serveur MCP qui orchestre des agents d'IA pour des tests de pénétration automatisés, a identifié plusieurs vulnérabilités critiques de type 0-day dans OpenClaw, notamment des injections de variables d'environnement, des contournements de permissions et des failles de divulgation d'informations que les scanners standards ont manquées.

OpenClawRadar