Le dépôt GitHub documente 16 techniques d'injection de prompt et des stratégies de défense pour les chats d'IA publics.

✍️ OpenClawRadar📅 Publié: March 10, 2026🔗 Source

Un développeur a créé un chat d'IA personnalisé sur son site web en tant qu'expérience et a rencontré plusieurs défis de sécurité lorsque de vrais utilisateurs ont tenté de le compromettre. Cette expérience a conduit à la création d'un guide de sécurité complet disponible sur GitHub.

Défis de sécurité rencontrés

Les utilisateurs ont tenté diverses attaques incluant :

Injection de prompt
Attaques de jeu de rôle
Astuces multilingues
Charges utiles encodées en base64

Stratégies de défense mises en œuvre

Le développeur a documenté une approche de défense en profondeur couvrant :

Assainissement des entrées
Limitation du débit
Conception de prompt système en approche zéro confiance
Contrôles de sortie
Plafonds de coût

Contenu du dépôt GitHub

Le dépôt inclut :

Une analyse des 16 techniques d'injection de prompt
Une compétence de code Claude qui teste automatiquement les 16 techniques contre votre chatbot
Les détails complets de mise en œuvre de la défense

Le développeur note que les utilisateurs ont essayé des choses qu'ils "n'auraient jamais pensé à tester" et que le guide est destiné à être utile pour toute personne mettant en œuvre des systèmes de chat d'IA publics similaires.

📖 Lire la source complète : r/ClaudeAI

👀 See Also

Security

Le problème des gardes en uniforme : pourquoi les environnements d'agents ont besoin d'identité, pas seulement de politiques

Le bac à sable openshell de Nemoclaw applique des politiques aux binaires, permettant aux logiciels malveillants de vivre sur le territoire en utilisant les mêmes binaires que l'agent. ZeroID, une couche d'identité d'agent open-source, applique des politiques de sécurité aux agents soutenus par des identités sécurisées.

May 1, 2026, 08:21 PM UTC

OpenClawRadar

Security

Fiche de référence sur la gestion de la surface d'attaque open-source publiée

Un développeur a publié une feuille de triche open-source pour la gestion de la surface d'attaque, qui couvre des flux de travail pratiques, des outils et des références. Le projet comprend des sections sur la découverte d'actifs, le suivi de l'infrastructure, les outils de reconnaissance, les flux de travail d'automatisation et les ressources d'apprentissage.

Mar 14, 2026, 08:45 AM UTC

OpenClawRadar

Security

L'étudiant contribue deux correctifs de sécurité au système de production OpenClaw.

Un développeur étudiant a corrigé une vulnérabilité 'fail-open' dans la logique de la passerelle d'OpenClaw (PR #29198) et une vulnérabilité de tabnabbing dans les images de chat (PR #18685), les deux correctifs ayant été intégrés respectivement dans les versions de production v2026.3.1 et v2026.2.24.

Mar 8, 2026, 09:45 PM UTC

OpenClawRadar

Security

Enveloppe de Contenu Externe d'OpenClaw pour la Défense contre l'Injection d'Invites

OpenClaw utilise un emballeur de contenu externe qui étiquette automatiquement les résultats de recherche web, les réponses d'API et les contenus similaires avec des avertissements indiquant qu'ils ne sont pas fiables, préparant le LLM à être sceptique et plus enclin à refuser des instructions malveillantes.

Apr 13, 2026, 11:45 PM UTC

OpenClawRadar