McpVanguard: Открытый прокси-сервер безопасности для ИИ-агентов на основе MCP

McpVanguard — это открытый прокси-сервер безопасности и межсетевой экран, разработанный специально для локальных ИИ-агентов, использующих Model Context Protocol (MCP). Он решает проблемы безопасности, возникающие при предоставлении LLM доступа к таким инструментам, как терминалы или файловые системы.
Как это работает
Прокси располагается между ИИ-агентом и инструментами MCP, оборачивая существующие MCP-серверы без необходимости переписывания настроек. Он может работать локально как лёгкий прокси или быть развёрнут как облачный шлюз, с доступным шаблоном Railway для более простого развёртывания.
Уровни безопасности
- Движок правил/сигнатур: Содержит около 50 YAML-сигнатур, которые обнаруживают распространённые атаки, такие как обратные оболочки, попытки SSRF и другие очевидные угрозы. Этот уровень добавляет примерно 16 мс задержки.
- Семантический оценочный уровень (опционально): Когда запросы выглядят подозрительно, но не явно вредоносными, они могут быть оценены небольшой LLM (Ollama или OpenAI), которая анализирует намерения.
- Мониторинг поведения: Блокирует аномальные паттерны, например, попытки агента прочитать сотни файлов за короткое время.
Возможности аудита
Каждый заблокированный запрос записывается в неизменяемый журнал аудита, который криптографически подписывается и хранится локально, предоставляя проверяемую запись о том, что было заблокировано и почему.
Инструмент был разработан для решения конкретных проблем безопасности в реализациях MCP, включая инъекции в промпты, обход путей и случайное удаление каталогов ИИ-агентами.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

FORGE: Фреймворк с открытым исходным кодом для тестирования безопасности ИИ-систем на основе LLM
FORGE — это автономный фреймворк для тестирования безопасности ИИ, который создаёт собственные инструменты в процессе работы, самовоспроизводится в рой и охватывает уязвимости из OWASP LLM Top 10, включая инъекцию промптов, фаззинг джейлбрейков и утечку данных из RAG.

Атака FlyTrap использует "враждебные зонтики" для компрометации автономных дронов на основе камер.
Исследователи из UC Irvine разработали FlyTrap — физическую атаку, использующую раскрашенные зонты для эксплуатации уязвимостей в камерных системах автономного слежения за целями. Атака сокращает дистанцию слежения до опасных уровней, позволяя захватывать дроны, атаковать сенсоры или вызывать физические столкновения.

OpenClaw Security: 13 практических шагов для защиты вашего ИИ-агента
В посте на Reddit изложены 13 мер безопасности для установок OpenClaw, включая запуск на отдельной машине, использование Tailscale для изоляции сети, изоляцию под-агентов в Docker и настройку белых списков для доступа пользователей.
