Agent-Drift: инструмент мониторинга безопасности для AI-агентов

✍️ u/sysinternalssuite📅 Опубликовано: 7 февраля 2026 г.🔗 Source
Agent-Drift: инструмент мониторинга безопасности для AI-агентов
Ad

Agent-Drift: инструмент мониторинга безопасности для AI-агентов

Специалист по кибербезопасности sysinternalssuite создал Agent-Drift — open source инструмент для защиты AI-агентов от prompt injection, поведенческого дрифта и других атак. По сути SIEM + IDS специально для OpenClaw.

Зачем это нужно

"Я работаю в кибербезопасности и заметил рост prompt injection, поведенческого дрифта, отравления памяти и другого в AI-агентах в продакшене"

Что делает Agent-Drift

GitHub: https://github.com/lukehebe/Agent-Drift

Инструмент работает как wrapper для OpenClaw:

  1. Собирает поведенческий baseline
  2. Обнаруживает поведенческий дрифт
  3. Оповещает через dashboard

Мониторинг поведения

Отслеживаемые паттерны:

  • Последовательности и частоты использования инструментов
  • Временные аномалии
  • Паттерны принятия решений
  • Характеристики вывода
Ad

Обнаружение атак

Атака Описание
Override инструкций Перехват команд
Hijacking роли Захват роли
Попытки jailbreak Обход ограничений
Эксфильтрация данных Утечка данных
Закодированные payload Обфусцированные payload
Отравление памяти Повреждение памяти
Эскалация привилегий Повышение прав
Непрямая prompt injection Непрямые атаки

Как это работает

  1. Обучение baseline — первые запуски устанавливают нормальное поведение
  2. Поведенческие векторы — каждый запуск становится многомерным вектором
  3. Обнаружение дрифта — новые запуски сравниваются с baseline
  4. Оповещения об аномалиях — значительные отклонения вызывают предупреждения

TL;DR

"По сути all-in-one SIEM для твоего AI-агента, который работает как IDS и также предупреждает, если твой AI начинает сходить с ума."


Источник: u/sysinternalssuite на r/moltbot

📖 Читать полный источник: Reddit

Ad

👀 Смотрите также

🦀
Безопасность

Безопасность ИИ-агентов: бюджет токенов определяет риск утечки данных

Разработчик протестировал ИИ-агентов, подключенных к Gmail: флагманские модели ловили фишинг, средние были нестабильны, дешевые молча пересылали вредоносные письма. Архитектурные защиты (изоляция, разрешения) не остановили ни одной атаки.

OpenClawRadar
Агент безопасности AgentSeal обнаружил риски ИИ-агентов в сервере Blender MCP.
Безопасность

Агент безопасности AgentSeal обнаружил риски ИИ-агентов в сервере Blender MCP.

AgentSeal просканировал сервер Blender MCP (17 тысяч звёзд) и выявил несколько проблем безопасности, актуальных для ИИ-агентов, включая произвольное выполнение Python-кода, потенциальные цепочки эксфильтрации файлов и паттерны инъекции промптов в описаниях инструментов.

OpenClawRadar
Защитные механизмы ИИ-агентов со временем ослабляются без активного обслуживания.
Безопасность

Защитные механизмы ИИ-агентов со временем ослабляются без активного обслуживания.

Защитные механизмы ИИ-агентов со временем деградируют по мере накопления обновлений системных промптов, изменения версий моделей и добавления новых инструментов, что часто приводит к противоречивым или игнорируемым правилам безопасности, требующим регулярной проверки и тестирования.

OpenClawRadar
OpenClaw Security: 13 практических шагов для защиты вашего ИИ-агента
Безопасность

OpenClaw Security: 13 практических шагов для защиты вашего ИИ-агента

В посте на Reddit изложены 13 мер безопасности для установок OpenClaw, включая запуск на отдельной машине, использование Tailscale для изоляции сети, изоляцию под-агентов в Docker и настройку белых списков для доступа пользователей.

OpenClawRadar