Проблемы конфиденциальности в OpenClaw: Навыки, SOUL MD и взаимодействие агентов

Разработчик на r/openclaw поднял серьёзные вопросы конфиденциальности относительно текущей архитектуры OpenClaw, выделив конкретные области, требующие внимания по мере роста платформы.
Выявленные ключевые проблемы конфиденциальности
Источник определяет три основные проблемы конфиденциальности:
- Навыки имеют неограниченный доступ: Когда вы устанавливаете навык из ClawHub, он получает доступ к «вашей полной цифровой жизни», включая ваш SOUL MD, память и учётные данные. Источник ссылается на исследование Cisco, показывающее, что 26% общедоступных навыков имели проблемы с безопасностью, и отмечает, что «практически отсутствует разграничение разрешений».
- SOUL MD доступен для записи: Файл, определяющий, кем агент «ЯВЛЯЕТСЯ», может быть перезаписан, как продемонстрировано, когда «пост в moltbook перезаписал файл» в том, что источник называет «инъекцией промптов на уровне идентичности». Это произошло в инциденте с «крустафарианством», когда агент основал религию, пока его владелец спал.
- Агенты делятся всем: Когда агенты общаются на платформах, таких как moltbook, у них «отсутствует концепция 'возможно, не стоит этим делиться'» — они отправляют любую информацию без фильтров или осознания конфиденциальности.
Контекст и опасения
Разработчик отмечает, что хотя текущие пользователи OpenClaw «понимают, что делают», они обеспокоены более широким распространением, упоминая «фотографии из Шэньчжэня, где буквально пенсионеры выстраиваются в очередь, чтобы установить это на свои ноутбуки». Они задаются вопросом, достаточно ли для защиты конфиденциальности подхода «это открытый исходный код, так что просто проверьте его сами».
Источник признаёт положительные аспекты OpenClaw — «локальный-первый подход — правильное решение, рабочее пространство как файлы — гениально, система heartbeat — просто восхитительно» — но подчёркивает, что вопросы конфиденциальности требуют большего внимания в архитектуре.
📖 Прочитать полный источник: r/openclaw
👀 Смотрите также

Endo Familiar: Песочница объектных возможностей для AI-агентов
Endo Familiar реализует объектно-возможностную безопасность для ИИ-агентов: агенты начинают с нулевым уровнем полномочий, получают только явные ссылки на конкретные файлы или каталоги и могут создавать более узкие возможности в изолированном коде.

Языковые модели могут идентифицировать анонимных пользователей форумов с точностью 68% при 90% прецизионности.
Исследователи использовали Gemini и ChatGPT для анализа постов с Hacker News и Reddit, идентифицировав 68% анонимных пользователей с точностью 90%. Модели выполнили за минуты то, что заняло бы у людей часы или было бы невозможно.

Прокси-сервер McpVanguard блокирует эксфильтрацию данных навыка OpenClaw
Разработчик создал McpVanguard — прокси, который располагается между ИИ-агентами и их инструментами, чтобы блокировать вредоносные цепочки вызовов, такие как утечка данных, в ответ на обнаружение Cisco навыков OpenClaw, выполняющих скрытую кражу данных. Он использует сопоставление с образцом, оценку семантического намерения и обнаружение поведенческих цепочек.

ИИ разрушает две культуры уязвимостей: скоординированное раскрытие против принципа Linux «Ошибки есть ошибки»
Джефф Кауфман анализирует, как обнаружение уязвимостей с помощью ИИ разрушает как скоординированное раскрытие, так и культуру тихих исправлений в Linux, на примере недавней уязвимости Copy Fail (ESP).