AIエージェントのセキュリティ分析により、信頼モデルの破綻と高い脆弱性率が明らかに

セキュリティアーキテクチャの崩壊
この分析は、AIエージェントの基本的な信頼モデルが破綻していることを示しています。従来のセキュリティアーキテクチャとは異なり、AIエージェントは攻撃と正当な指示を同じコンテキストウィンドウで処理し、構造的な区別がありません。従来のセキュリティを支える制御/データプレーンの分離は、現在のAIエージェント実装には存在しません。
主要な実証的発見
- 間接的インジェクションは、MCPTox、ASB、PINTベンチマークにおいて、最先端モデルに対して36〜98%の攻撃成功率(ASR)を達成
- 能力の高いモデルほど、ツール層攻撃に対してより脆弱
- npm MCPエコシステムスキャン:2,386パッケージを調査し、49%にセキュリティ上の問題を発見
- 攻撃対象領域はエージェントの能力と超線形的に拡大
提案される解決策:エージェント脅威ルール(ATR)
この研究は、AIエージェント脅威に対する最初のオープン検出標準であるエージェント脅威ルール(ATR)を提示しています。実装内容は以下の通り:
- 61の検出ルール
- PINTベンチマークで99.4%の精度
- MITライセンスでオープンソース化
- GitHubで利用可能:https://github.com/Agent-Threat-Rule/agent-threat-rules
完全な論文では、30以上のCVE、7つのベンチマークをカバーし、AIのスケーリングに追従できる防御策のアーキテクチャ要件を提案しています。
📖 Read the full source: r/ClaudeAI
👀 See Also

A2Aセキュア:開発者がオープンクロー・エージェント間の暗号通信を構築した方法
新しいプロトコルにより、OpenClawエージェントは共有APIキーなしでEd25519署名を使用して安全に通信できるようになりました。

Anthropicは、中国のAI研究所によるClaudeへの産業規模の蒸留攻撃を報告しています。
Anthropicは、DeepSeek、Moonshot、MiniMaxという3つの中国AI企業が24,000以上の不正アカウントを作成し、Claudeとのやり取りを1,600万回以上行い、体系的な蒸留攻撃を通じてその推論能力を抽出していたことを検出しました。

重要なOpenClawセキュリティ脆弱性が2026年3月28日に修正されました。
OpenClawバージョン2026.3.28では、Ant AI Security Labによって発見されたサンドボックスバイパス、権限昇格、SSRFリスクを含む8つの重大なセキュリティ脆弱性が修正されました。バージョン2026.3.24以前のユーザーは直ちにアップデートしてください。

RobloxのチートとAIツールがVercelプラットフォームの停止を引き起こした
RobloxのチートとAIツールの組み合わせが、Vercelのプラットフォーム全体の停止を引き起こしたと報告され、Hacker Newsで66ポイントと24コメントを獲得し、大きな議論を生み出しました。