49% пакетов MCP уязвимы: анализ безопасности ИИ-агентов

Разбор архитектуры безопасности

Анализ показывает, что фундаментальная модель доверительных отношений для ИИ-агентов нарушена. В отличие от традиционных архитектур безопасности, ИИ-агенты обрабатывают атаки и легитимные инструкции через одно и то же контекстное окно без структурного разделения. Разделение плоскостей управления и данных, лежащее в основе традиционной безопасности, отсутствует в текущих реализациях ИИ-агентов.

Ключевые эмпирические выводы

Косвенное внедрение достигает 36-98% успешности атак (ASR) на передовые модели в бенчмарках MCPTox, ASB и PINT
Более мощные модели БОЛЕЕ уязвимы к атакам на инструментальном уровне
Сканирование экосистемы npm MCP: изучено 2 386 пакетов, 49% содержат проблемы безопасности
Поверхности атак растут сверхлинейно с ростом возможностей агента

Предлагаемое решение: Правила угроз агентов (ATR)

Исследование представляет Правила угроз агентов (ATR) — первый открытый стандарт обнаружения угроз для ИИ-агентов. Реализация включает:

61 правило обнаружения
99,4% точности на бенчмарке PINT
Открытый исходный код с лицензией MIT
Доступно на GitHub: https://github.com/Agent-Threat-Rule/agent-threat-rules

Полная статья охватывает 30+ CVE, 7 бенчмарков и предлагает архитектурные требования для защитных механизмов, способных идти в ногу с масштабированием ИИ.

📖 Read the full source: r/ClaudeAI

Анализ безопасности ИИ-агентов выявляет нарушенную модель доверия и высокий уровень уязвимостей.

Разбор архитектуры безопасности

Ключевые эмпирические выводы

Предлагаемое решение: Правила угроз агентов (ATR)

👀 Смотрите также

Настольное приложение Claude от Anthropic устанавливает нераскрытый мост нативной передачи сообщений

Уязвимость OpenClaw: 42,000 случаев раскрытия данных

大规模NPM和PyPI供应链攻击影响TanStack、Mistral AI及170多个软件包

Предупреждение системы безопасности: Вредоносный код в LiteLLM может похищать API-ключи