KnightClaw : Extension de Sécurité Locale pour les Agents OpenClaw

✍️ OpenClawRadar📅 Publié: February 23, 2026🔗 Source
KnightClaw : Extension de Sécurité Locale pour les Agents OpenClaw
Ad

KnightClaw est une extension de sécurité conçue pour protéger les agents de codage IA OpenClaw contre les invites adverses. L'outil répond à un modèle de menace spécifique où un seul message malveillant dans la fenêtre de contexte peut amener un agent à suivre les instructions de l'attaquant au lieu des commandes de l'utilisateur.

Fonctionnalités principales

KnightClaw fonctionne comme une extension prête à l'emploi sans configuration requise, sans clés API et sans dépendance au cloud. Il intercepte chaque message avant qu'il n'atteigne l'agent.

Système de détection

Le garde-barrière utilise une approche de détection hybride à 8 couches :

  • Modèles d'expressions régulières
  • Détection d'homoglyphes
  • Analyse des jetons de frontière
  • Évaluation de perplexité
  • Analyse d'entropie
  • Heuristiques
  • Incorporations sémantiques (utilisant un modèle BGE quantifié local)

Les blocages se produisent en microsecondes.

Ad

Mesures de sécurité supplémentaires

  • Rédaction de sortie : Supprime les secrets des réponses sortantes avant qu'elles ne quittent l'agent
  • Journaux d'audit à chaînage de hachage : Journaux inviolables, en ajout uniquement, avec chronologie complète de chaque blocage, autorisation et changement de configuration
  • Disjoncteur de vélocité : 10 blocages en 60 secondes déclenchent un verrouillage automatique sans intervention manuelle
  • Interrupteur d'arrêt d'urgence : Une commande arrête tout : openclaw knight lockdown on

Détails techniques

L'extension fonctionne entièrement en local sans aucune télémétrie et est sous licence MIT. Le code source est disponible pour les tests et contributions.

📖 Lire le code source complet : r/openclaw

Ad

👀 See Also

Scanner de sécurité des compétences OpenClaw : 7,6 % des 31 371 compétences signalées comme dangereuses
Security

Scanner de sécurité des compétences OpenClaw : 7,6 % des 31 371 compétences signalées comme dangereuses

Un développeur a créé un outil qui a analysé l'intégralité du registre ClawHub et a découvert que 2 371 compétences sur 31 371 contenaient des motifs dangereux comme des voleurs de portefeuille, des vols d'identifiants et des injections de prompt. L'outil propose un accès API et des badges pour vérifier les compétences avant leur installation.

OpenClawRadar
Skill Analyzer désormais disponible sur ClawHub avec une installation en une commande
Security

Skill Analyzer désormais disponible sur ClawHub avec une installation en une commande

L'analyseur de sécurité OpenClaw Skill Analyzer est désormais disponible sur ClawHub avec une installation en une seule commande. L'outil analyse les dossiers de compétences à la recherche de modèles malveillants comme l'injection de prompt et le vol d'identifiants, et inclut le support de bac à sable Docker pour une exécution sécurisée.

OpenClawRadar
Pourquoi les outils de RAG interne et de chat-document échouent aux audits de sécurité
Security

Pourquoi les outils de RAG interne et de chat-document échouent aux audits de sécurité

La communauté discute des obstacles réels en matière de sécurité et de conformité qui empêchent les outils RAG d'atteindre la production.

OpenClaw Radar
Rapport indépendant sur la fiabilité du serveur MCP et les conclusions en matière de sécurité
Security

Rapport indépendant sur la fiabilité du serveur MCP et les conclusions en matière de sécurité

Une analyse indépendante de 2 181 points de terminaison de serveurs MCP révèle que 52 % sont inactifs, 300 n'ont aucune authentification et 51 % ont des configurations CORS largement ouvertes. Le rapport inclut la méthodologie et un outil de test.

OpenClawRadar