エージェント・ドリフト:AIエージェント向けセキュリティ監視ツール

✍️ u/sysinternalssuite📅 公開日: February 7, 2026🔗 Source
エージェント・ドリフト:AIエージェント向けセキュリティ監視ツール
Ad

Agent-Drift: AIエージェント向けセキュリティ監視ツール

サイバーセキュリティ専門家sysinternalssuiteがAgent-Driftを作成しました。これは、プロンプトインジェクション、行動ドリフト、その他の攻撃からAIエージェントを保護するオープンソースツールです。本質的には、OpenClaw専用のSIEM + IDSです。

なぜこれが必要か

「私はサイバーセキュリティ分野で働いており、AIエージェントに対するプロンプトインジェクション、行動ドリフト、メモリ汚染などの攻撃が実際に増加していることに気づきました」

Agent-Driftの機能

GitHub: https://github.com/lukehebe/Agent-Drift

このツールはOpenClawのラッパーとして機能します:

  1. 行動ベースラインを収集
  2. 行動ドリフトを検出
  3. ダッシュボードを通じてアラート

行動監視

追跡されるパターン:

  • ツール使用の順序と頻度
  • タイミングの異常
  • 決定パターン
  • 出力特性
Ad

攻撃検出

攻撃 説明
命令の上書き コマンドの乗っ取り
役割の乗っ取り 役割の奪取
脱獄試行 制限の回避
データ流出 データ漏洩
エンコードされたペイロード 難読化されたペイロード
メモリ汚染 メモリ破損
権限昇格 権限の向上
間接的なプロンプトインジェクション 間接的な攻撃

仕組み

  1. ベースライン学習 — 最初の実行で通常の行動を確立
  2. 行動ベクトル — 各実行が多次元ベクトルになる
  3. ドリフト検出 — 新しい実行をベースラインと比較
  4. 異常アラート — 大きな逸脱が警告をトリガー

要約

「基本的には、AIエージェント向けのオールインワンセキュリティインシデントイベントマネージャー(SIEM)であり、侵入検知システム(IDS)として機能し、AIが異常な行動を始めた場合にも警告します。」


出典: u/sysinternalssuite on r/moltbot

📖 全文を読む: Reddit

Ad

👀 See Also

ゼロトラスト・オープンクローアーキテクチャは、実行前認可と実行後検証を追加します。
Security

ゼロトラスト・オープンクローアーキテクチャは、実行前認可と実行後検証を追加します。

OpenClawのオープンソースアーキテクチャは、2つのセキュリティチェックポイントを追加します:実行前にツール呼び出しをインターセプトし、サブミリ秒の認可オーバーヘッドを実現するRustサイドカーと、LLMの判断ではなくアサーションを使用した決定論的な実行後検証です。システムには、DOMスナップショットとスクリーンショットによるトレーシング、さらにトークン使用量を90-99%削減するDOM圧縮スキルが含まれています。

OpenClawRadar
LLMエージェントにおけるツール権限注入:ツール出力がシステム意図を上書きする場合
Security

LLMエージェントにおけるツール権限注入:ツール出力がシステム意図を上書きする場合

研究者がローカルLLMエージェントラボを構築し、「ツール権限インジェクション」を実証しました。これは、AIエージェントにおいてツールの出力がシステムの意図を上書きするシナリオです。

OpenClawRadar
なぜ内部RAGとドキュメントチャットツールはセキュリティ監査に不合格となるのか
Security

なぜ内部RAGとドキュメントチャットツールはセキュリティ監査に不合格となるのか

コミュニティでは、RAGツールが本番環境に到達するのを妨げる現実世界のセキュリティとコンプライアンスの障壁について議論されています。

OpenClaw Radar
Claude Androidアプリ、明示的なユーザー操作なしにクリップボードを読み取ると報告される
Security

Claude Androidアプリ、明示的なユーザー操作なしにクリップボードを読み取ると報告される

ユーザーが報告したところによると、Claude Androidアプリがクリップボードからコードを分析したとのこと。ユーザーが貼り付けを行わなかったにもかかわらず、Claudeはファイルをpasted_text_b4a56202-3d12-43c8-aa31-a39367a9a354.txtとして識別しました。この動作はその後のテストでは再現できませんでした。

OpenClawRadar