KnightClaw: OpenClawエージェント向けローカルセキュリティ拡張機能

KnightClawは、OpenClaw AIコーディングエージェントを敵対的プロンプトから保護するために設計されたセキュリティ拡張機能です。このツールは、コンテキストウィンドウ内の単一の悪意あるメッセージが、エージェントにユーザーのコマンドではなく攻撃者の指示に従わせる可能性があるという特定の脅威モデルに対処します。
主要機能
KnightClawは、設定不要、APIキー不要、クラウド依存なしのドロップイン拡張機能として動作し、エージェントに到達する前のすべてのメッセージを傍受します。
検知システム
このガードは8層のハイブリッド検知アプローチを採用しています:
- 正規表現パターン
- ホモグリフ検知
- 境界トークン分析
- パープレキシティスコアリング
- エントロピー分析
- ヒューリスティック
- 意味的埋め込み(ローカルの量子化BGEモデルを使用)
ブロックはマイクロ秒単位で発生します。
追加のセキュリティ対策
- 出力編集: エージェントから外部に送信される前に、応答からシークレットを除去します
- ハッシュチェーン監査ログ: 改ざん防止、追記専用のログで、すべてのブロック、許可、設定変更の完全なタイムラインを記録
- 速度サーキットブレーカー: 60秒間に10回のブロックが発生すると、手動介入なしで自動的にロックダウンを発動
- キルスイッチ: 1つのコマンドですべてを停止:
openclaw knight lockdown on
技術詳細
この拡張機能は完全にローカルで動作し、テレメトリーは一切なく、MITライセンスで提供されています。ソースコードはテストと貢献のために公開されています。
📖 完全なソースを読む: r/openclaw
👀 See Also

フライトラップ攻撃は、敵対的傘を用いてカメラベースの自律ドローンのセキュリティを脅かします。
カリフォルニア大学アーバイン校の研究者らは、塗装された傘を利用してカメラベースの自律ターゲット追跡システムの脆弱性を悪用する物理的攻撃フレームワーク「FlyTrap」を開発しました。この攻撃は追跡距離を危険なレベルまで縮め、ドローン捕獲、センサー攻撃、または物理的衝突を可能にします。

Claw HubとHugging Faceが575の悪意あるスキルパッケージに襲撃される
Claw HubとHugging Faceの両方が侵害され、575個の悪意あるスキルパッケージがアップロードされました。開発者はこれらのプラットフォームから使用するスキルを確認するよう警告されています。

OpenClawユーザーがエージェントの自律性とウェブセキュリティのバランスを取る戦略を共有
OpenClawのユーザーが現在直面している課題について説明しています:エージェントの自律性とセキュリティのバランス、特にウェブアクセスとプロンプトインジェクションのリスクに関してです。彼らは「低信頼」と「高信頼」のエージェントセグメントを人間の承認ゲートと共に使用する解決策を提案しています。

潜在的なClaudeセキュリティインシデント:自己送信パスワードアラートと不審な.NETプロセス
ユーザーがClaudeにログイン後、自身のアカウントから送信されたように見える不審なパスワードリセット通知を受け取ったと報告。数分後にメールが消失し、異常な.NETプロセスがシステムシャットダウンを妨げた。