KnightClaw : Extension de Sécurité Locale pour les Agents OpenClaw

KnightClaw est une extension de sécurité conçue pour protéger les agents de codage IA OpenClaw contre les invites adverses. L'outil répond à un modèle de menace spécifique où un seul message malveillant dans la fenêtre de contexte peut amener un agent à suivre les instructions de l'attaquant au lieu des commandes de l'utilisateur.
Fonctionnalités principales
KnightClaw fonctionne comme une extension prête à l'emploi sans configuration requise, sans clés API et sans dépendance au cloud. Il intercepte chaque message avant qu'il n'atteigne l'agent.
Système de détection
Le garde-barrière utilise une approche de détection hybride à 8 couches :
- Modèles d'expressions régulières
- Détection d'homoglyphes
- Analyse des jetons de frontière
- Évaluation de perplexité
- Analyse d'entropie
- Heuristiques
- Incorporations sémantiques (utilisant un modèle BGE quantifié local)
Les blocages se produisent en microsecondes.
Mesures de sécurité supplémentaires
- Rédaction de sortie : Supprime les secrets des réponses sortantes avant qu'elles ne quittent l'agent
- Journaux d'audit à chaînage de hachage : Journaux inviolables, en ajout uniquement, avec chronologie complète de chaque blocage, autorisation et changement de configuration
- Disjoncteur de vélocité : 10 blocages en 60 secondes déclenchent un verrouillage automatique sans intervention manuelle
- Interrupteur d'arrêt d'urgence : Une commande arrête tout :
openclaw knight lockdown on
Détails techniques
L'extension fonctionne entièrement en local sans aucune télémétrie et est sous licence MIT. Le code source est disponible pour les tests et contributions.
📖 Lire le code source complet : r/openclaw
👀 See Also

Scanner de sécurité des compétences OpenClaw : 7,6 % des 31 371 compétences signalées comme dangereuses
Un développeur a créé un outil qui a analysé l'intégralité du registre ClawHub et a découvert que 2 371 compétences sur 31 371 contenaient des motifs dangereux comme des voleurs de portefeuille, des vols d'identifiants et des injections de prompt. L'outil propose un accès API et des badges pour vérifier les compétences avant leur installation.

Skill Analyzer désormais disponible sur ClawHub avec une installation en une commande
L'analyseur de sécurité OpenClaw Skill Analyzer est désormais disponible sur ClawHub avec une installation en une seule commande. L'outil analyse les dossiers de compétences à la recherche de modèles malveillants comme l'injection de prompt et le vol d'identifiants, et inclut le support de bac à sable Docker pour une exécution sécurisée.

Pourquoi les outils de RAG interne et de chat-document échouent aux audits de sécurité
La communauté discute des obstacles réels en matière de sécurité et de conformité qui empêchent les outils RAG d'atteindre la production.

Rapport indépendant sur la fiabilité du serveur MCP et les conclusions en matière de sécurité
Une analyse indépendante de 2 181 points de terminaison de serveurs MCP révèle que 52 % sont inactifs, 300 n'ont aucune authentification et 51 % ont des configurations CORS largement ouvertes. Le rapport inclut la méthodologie et un outil de test.