AIエージェント脅威：ツール悪用6.4%増、マルチモーダル攻撃2.3%出現

本番AIエージェントデータからの脅威状況

47のデプロイメントにわたる91,284件のAIエージェント対話からの実世界の脅威データは、2026年2月に35,711件の脅威が検出されたことを示しています。検出モデルはGemmaベースの5ヘッドマルチラベル分類器を使用しています。

ツール/コマンドの悪用: 脅威の14.5%に6.4%増加。主要パターンは、無害な読み取り呼び出しの後に書き込みや実行が続くツールチェーンエスカレーションです。ほとんどのローカル設定では、十分な保護策なしにエージェントにツールアクセスを許可しています。
エージェント目標のハイジャック: 脅威の6.9%に倍増。自律エージェントループの計画段階を標的としており、エージェント状態の監視が少ないローカル設定で特に重要です。
RAGポイズニング: メタデータ攻撃に移行し12.0%（10.0%から増加）。新しいパターンはコンテンツではなく、ドキュメントメタデータ（タイトル、著者、注釈）を標的としています。多くの人はコンテンツをサニタイズしますが、メタデータはそのまま通過させます。
マルチモーダルインジェクション: 指示が画像やPDFに隠される新しい脅威で2.3%。テキストのみの安全スキャンではこれらの攻撃を見逃します。