Анализ безопасности изоляции агентов: от отсутствия песочницы до виртуальных машин Firecracker

В посте на Reddit анализируется, как различные ИИ-агенты для написания кода обрабатывают изоляцию рабочих нагрузок, выделяя значительные различия в безопасности между подходами.
Текущие методы изоляции
Анализ охватывает пять платформ:
- Cursor: Запускает команды напрямую в вашей оболочке без песочницы
- Claude Code: Не указано подробно
- Devin: Не указано подробно
- OpenAI: Не указано подробно
- E2B: Использует аппаратно-изолированные микровиртуальные машины Firecracker
Сравнение безопасности
Источник предоставляет конкретные данные о безопасности:
- Среда выполнения контейнеров ежегодно с 2019 года имела уязвимости типа CVE, позволяющие сбежать из контейнера
- У Firecracker за семь лет не было ни одного случая побега из гостевой системы на хост
- AWS заявила: "мы не считаем контейнеры границей безопасности"
Реальные инциденты
В посте рассматриваются несколько инцидентов безопасности:
- Devin был взят под контроль через один отравленный issue на GitHub
- Инцидент с утечкой данных в Slack AI
- Атака на цепочку поставок Clinejection
Ключевые концепции
Анализ определяет:
- Пять предположений, которые делает традиционная изоляция и которые нарушают агенты
- Шесть измерений изоляции, которые будут исследованы в серии
Для разработчиков, использующих ИИ-агентов для написания кода, это подчеркивает важность понимания того, как ваш агент выполняет код, и последствий для безопасности различных подходов к изоляции.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Атака FlyTrap использует "враждебные зонтики" для компрометации автономных дронов на основе камер.
Исследователи из UC Irvine разработали FlyTrap — физическую атаку, использующую раскрашенные зонты для эксплуатации уязвимостей в камерных системах автономного слежения за целями. Атака сокращает дистанцию слежения до опасных уровней, позволяя захватывать дроны, атаковать сенсоры или вызывать физические столкновения.

Инструмент поиска бесед Claude по-прежнему возвращает удалённые чаты
Пользователь Claude Pro обнаружил, что удаленные диалоги остаются доступными для поиска через инструмент поиска диалогов Claude, возвращая содержательную информацию, включая заголовки, количество сообщений и выдержки, несмотря на то, что ссылки на чаты не работают.

Предотвращение участия ИИ-агентов в ботнетах: вопросы безопасности
Сообщество обсуждает защиту автономных ИИ-агентов от захвата и использования в вредоносных ботнетах.

Сандер: Локальный фаервол конфиденциальности на основе Rust для LLM.
Sunder — это расширение для Chrome, которое действует как локальный прививочный экран конфиденциальности для AI-чатов, созданное с использованием Rust и WebAssembly, гарантируя, что конфиденциальные данные никогда не покинут ваш браузер.