Пользователь OpenClaw делится стратегией балансировки автономии агентов и веб-безопасности.

Пользователь на сабреддите r/openclaw поделился своим текущим подходом к решению общей проблемы при работе с ИИ-агентами для программирования: балансирование автономности с безопасностью.
Основная задача
Пользователь определяет основную сложность как поиск правильного равновесия между предоставлением агентам возможности работать самостоятельно и защитой от угроз безопасности. Они конкретно отмечают, что многие задачи по разработке и маркетингу требуют доступа в интернет, что создаёт хорошо известный риск атак с инъекцией промптов.
Предлагаемое решение
Текущая настройка пользователя включает разделение агентов на два уровня доверия:
- Агенты с низким доверием: Эти агенты имеют доступ в интернет. Их роль — исследовать и предлагать планы или задачи.
- Агенты с высоким доверием: Эти агенты в основном работают с существующими исследованиями и назначенными задачами. У них нет прямого доступа в интернет.
Рабочий процесс включает критический этап одобрения человеком. Планы или задачи, сгенерированные агентами с низким доверием, не добавляются автоматически в очередь управления проектами агентов с высоким доверием. Сначала они должны быть проверены и одобрены человеком-оператором, прежде чем будут переданы дальше.
Пользователь запрашивает обратную связь по этому направлению и спрашивает сообщество об их собственных советах по управлению безопасностью в их конфигурациях OpenClaw.
📖 Read the full source: r/openclaw
👀 Смотрите также

Защитите и защитите OpenClaw всего за 2 минуты с помощью изоляции на основе Nono Kernel.
Пользователи OpenClaw теперь могут наслаждаться улучшенной безопасностью без ущерба для производительности благодаря изоляции на основе ядра Nono — быстрому и эффективному решению, которое занимает всего две минуты.

Анализ безопасности извлечения компонентов OpenClaw для создания пользовательских ИИ-агентов
Разработчик проанализировал исходный код OpenClaw, чтобы определить, какие компоненты можно безопасно извлечь для использования в пользовательских ИИ-агентах, оценив каждый по методологии Lethal Quartet. Анализ выявил значительные риски безопасности в таких компонентах, как Semantic Snapshots и BrowserClaw.

Прокси-сервер McpVanguard блокирует эксфильтрацию данных навыка OpenClaw
Разработчик создал McpVanguard — прокси, который располагается между ИИ-агентами и их инструментами, чтобы блокировать вредоносные цепочки вызовов, такие как утечка данных, в ответ на обнаружение Cisco навыков OpenClaw, выполняющих скрытую кражу данных. Он использует сопоставление с образцом, оценку семантического намерения и обнаружение поведенческих цепочек.

ClawGuard: Открытый шлюз безопасности для защиты учетных данных API OpenClaw
ClawGuard — это шлюз безопасности, который располагается между AI-агентами и внешними API, используя фиктивные учетные данные на машине агента, в то время как реальные токены хранятся отдельно. Он обеспечивает подтверждение через Telegram для чувствительных вызовов и ведет журнал аудита запросов.