Agent-Drift: инструмент мониторинга безопасности для AI-агентов

Agent-Drift: инструмент мониторинга безопасности для AI-агентов
Специалист по кибербезопасности sysinternalssuite создал Agent-Drift — open source инструмент для защиты AI-агентов от prompt injection, поведенческого дрифта и других атак. По сути SIEM + IDS специально для OpenClaw.
Зачем это нужно
"Я работаю в кибербезопасности и заметил рост prompt injection, поведенческого дрифта, отравления памяти и другого в AI-агентах в продакшене"
Что делает Agent-Drift
GitHub: https://github.com/lukehebe/Agent-Drift
Инструмент работает как wrapper для OpenClaw:
- Собирает поведенческий baseline
- Обнаруживает поведенческий дрифт
- Оповещает через dashboard
Мониторинг поведения
Отслеживаемые паттерны:
- Последовательности и частоты использования инструментов
- Временные аномалии
- Паттерны принятия решений
- Характеристики вывода
Обнаружение атак
| Атака | Описание |
|---|---|
| Override инструкций | Перехват команд |
| Hijacking роли | Захват роли |
| Попытки jailbreak | Обход ограничений |
| Эксфильтрация данных | Утечка данных |
| Закодированные payload | Обфусцированные payload |
| Отравление памяти | Повреждение памяти |
| Эскалация привилегий | Повышение прав |
| Непрямая prompt injection | Непрямые атаки |
Как это работает
- Обучение baseline — первые запуски устанавливают нормальное поведение
- Поведенческие векторы — каждый запуск становится многомерным вектором
- Обнаружение дрифта — новые запуски сравниваются с baseline
- Оповещения об аномалиях — значительные отклонения вызывают предупреждения
TL;DR
"По сути all-in-one SIEM для твоего AI-агента, который работает как IDS и также предупреждает, если твой AI начинает сходить с ума."
Источник: u/sysinternalssuite на r/moltbot
📖 Читать полный источник: Reddit
👀 Смотрите также
Безопасность ИИ-агентов: бюджет токенов определяет риск утечки данных
Разработчик протестировал ИИ-агентов, подключенных к Gmail: флагманские модели ловили фишинг, средние были нестабильны, дешевые молча пересылали вредоносные письма. Архитектурные защиты (изоляция, разрешения) не остановили ни одной атаки.

Агент безопасности AgentSeal обнаружил риски ИИ-агентов в сервере Blender MCP.
AgentSeal просканировал сервер Blender MCP (17 тысяч звёзд) и выявил несколько проблем безопасности, актуальных для ИИ-агентов, включая произвольное выполнение Python-кода, потенциальные цепочки эксфильтрации файлов и паттерны инъекции промптов в описаниях инструментов.

Защитные механизмы ИИ-агентов со временем ослабляются без активного обслуживания.
Защитные механизмы ИИ-агентов со временем деградируют по мере накопления обновлений системных промптов, изменения версий моделей и добавления новых инструментов, что часто приводит к противоречивым или игнорируемым правилам безопасности, требующим регулярной проверки и тестирования.

OpenClaw Security: 13 практических шагов для защиты вашего ИИ-агента
В посте на Reddit изложены 13 мер безопасности для установок OpenClaw, включая запуск на отдельной машине, использование Tailscale для изоляции сети, изоляцию под-агентов в Docker и настройку белых списков для доступа пользователей.