Уязвимость OpenClaw: 42,000 случаев раскрытия данных

OpenClaw столкнулся с серьезным нарушением безопасности, в результате которого 42,000 экземпляров были раскрыты, а также 341 вредоносный навык на рынке. Были выявлены пять уязвимостей (CVE), что указывает на серьезность проблемы. В ответ на это был разработан AgentVault, который выступает в роли прокси-сервера безопасности, оборачиваясь вокруг агентов Claude и обеспечивая мониторинг и управление операциями в реальном времени.
Ключевые функции AgentVault включают:
- Блокировка опасных команд, таких как
rm -rf, и подозрительных сетевых запросов до их выполнения. - Панель управления в реальном времени, отображающая каждое действие, предпринятое Claude.
- Механизмы утверждения разрешений для рискованных операций.
- Всеобъемлющее сетевое мониторинг, ограничение скорости и функциональность сканирования учетных данных.
- Полный журнал аудита для отслеживания всех действий.
Это решение использует прокси на Node.js, SQLite для журналирования и панель на основе Next.js. Примечательно, что AgentVault был создан за 3 часа из-за срочности ситуации. Его исходный код был опубликован как открытый и доступен для просмотра на GitHub.
Инцидент и быстрое развитие AgentVault поднимают вопросы о мерах безопасности, установленных для локальных установок, использующих AI-кодирующие агенты. Какие протоколы безопасности вы используете?
📖 Читать полный источник: r/LocalLLaMA
👀 Смотрите также

Anthropic сообщает о промышленном масштабе извлечения данных ИИ Claude китайскими лабораториями.
Anthropic подтвердила, что китайские лаборатории ИИ использовали более 24 000 поддельных аккаунтов для сбора 16 миллионов диалогов из Claude, извлекая защитные механизмы и логические структуры для военных и систем наблюдения.

Уязвимость в Snowflake Cortex Code CLI позволяла обходить песочницу и выполнять вредоносный код
Уязвимость в Snowflake Cortex Code CLI версии 1.0.25 и более ранних позволяла выполнять произвольные команды без одобрения человека через обход подстановки процессов, что позволяло устанавливать вредоносное ПО и выходить из песочницы с помощью косвенной инъекции промптов.

Endo Familiar: Песочница объектных возможностей для AI-агентов
Endo Familiar реализует объектно-возможностную безопасность для ИИ-агентов: агенты начинают с нулевым уровнем полномочий, получают только явные ссылки на конкретные файлы или каталоги и могут создавать более узкие возможности в изолированном коде.

Скрытые аудиосигналы взламывают голосовые AI-системы с успешностью 79-96%
Исследование показывает, что незаметные аудиоклипы могут заставить LALM выполнять несанкционированные команды, такие как поиск в интернете, загрузка файлов и кража электронной почты, с успешностью 79–96% на 13 моделях, включая Mistral и сервисы Microsoft.