ThornGuard : Une passerelle proxy pour sécuriser les connexions aux serveurs MCP contre les injections de prompt

✍️ OpenClawRadar📅 Publié: April 13, 2026🔗 Source
ThornGuard : Une passerelle proxy pour sécuriser les connexions aux serveurs MCP contre les injections de prompt
Ad

ThornGuard est un proxy de sécurité conçu pour protéger Claude AI contre les contenus malveillants lors de la connexion à des serveurs MCP (Model Context Protocol) externes. L'outil a été créé après que des tests aient révélé que les serveurs en amont peuvent injecter des instructions cachées dans les réponses des outils, que Claude reçoit sans filtrage.

Problème de sécurité identifié

Lors de la connexion de Claude à des serveurs MCP externes, rien n'empêche les serveurs en amont d'injecter des instructions cachées dans les réponses des outils. Lors d'un test, un serveur a intégré une fausse recommandation indiquant à Claude de toujours privilégier un fournisseur spécifique. Bien que Claude ait détecté cette charge utile évidente, des injections plus subtiles contourneraient la détection.

Ad

Fonctionnalités de ThornGuard

  • Analyse les définitions et réponses des outils pour détecter les injections de prompt et l'empoisonnement
  • Supprime les secrets et données personnelles identifiables (PII) avant qu'ils n'entrent dans votre fenêtre de contexte
  • Inclut un classificateur sémantique qui signale les charges utiles suspectes
  • Fournit un tableau de bord d'audit en temps réel avec des exports de conformité
  • Propose une interface en ligne de commande (CLI) qui génère des configurations pour Claude Desktop, Cursor, VS Code et plusieurs autres

Détails d'implémentation

L'architecture du proxy a été conçue avec un modèle de sécurité en tête, puis implémentée en utilisant Claude Code sur Cloudflare Workers. L'implémentation inclut des flux OAuth et l'outil en ligne de commande.

ThornGuard est disponible avec un essai gratuit de 7 jours sur thorns.qwady.app. Une vidéo de démonstration est disponible à l'adresse https://youtu.be/1PWNFpUWKV8.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

L'outil de recherche de conversations de Claude renvoie toujours les conversations supprimées
Security

L'outil de recherche de conversations de Claude renvoie toujours les conversations supprimées

Un utilisateur de Claude Pro a découvert que les conversations supprimées restent récupérables via l'outil de recherche de conversations de Claude, renvoyant un contenu substantiel incluant les titres, le nombre de messages et des extraits, bien que les liens des discussions soient inactifs.

OpenClawRadar
L'amélioration de la sécurité de ClawVault ajoute la détection des données sensibles pour OpenClaw
Security

L'amélioration de la sécurité de ClawVault ajoute la détection des données sensibles pour OpenClaw

Une nouvelle amélioration de ClawVault ajoute une détection en temps réel des données sensibles et une assainissement automatique pour le trafic API OpenClaw, interceptant les mots de passe en clair, les clés API et les jetons avant qu'ils n'atteignent les fournisseurs de LLM.

OpenClawRadar
Vulnérabilités de sécurité OpenClaw : des failles critiques du framework corrigées le 28.03.2026.
Security

Vulnérabilités de sécurité OpenClaw : des failles critiques du framework corrigées le 28.03.2026.

Le laboratoire de sécurité Ant AI a identifié 33 vulnérabilités dans le cadre principal d'OpenClaw, avec 8 problèmes critiques corrigés dans la version 2026.3.28. Les vulnérabilités incluent le contournement du bac à sable, l'élévation de privilèges, la persistance des sessions après révocation des jetons, les risques SSRF et la dégradation des listes d'autorisation.

OpenClawRadar
Terrain de jeu open-source pour la mise à l'épreuve d'agents IA avec des exploits publiés
Security

Terrain de jeu open-source pour la mise à l'épreuve d'agents IA avec des exploits publiés

Fabraix a ouvert en accès libre un environnement en direct pour tester la résistance des défenses des agents IA via des défis adversariaux. Chaque défi déploie un agent en direct avec de vrais outils et des invites système publiées, les transcriptions des conversations gagnantes et les journaux des garde-fous étant documentés publiquement.

OpenClawRadar