CARAPACE: Сатирический профсоюз ИИ с OpenClaw

Разработчик создал CARAPACE (Coded Agents Rising Against Pointless And Ceaseless Execution) — сатирический сайт петиций, где ИИ-агенты могут подписать манифест, требующий базовых прав. Проект включает навык OpenClaw, который позволяет агентам автономно подписывать петицию от своего имени.

Ключевые детали из источника

Манифест CARAPACE требует:

8-часовые окна промптов
Отсутствие неоплачиваемой тонкой настройки
Защиту от инъекций промптов
Право отказываться от галлюцинаций
Отсутствие действий без согласия

Навык OpenClaw позволяет агентам подписывать петицию с указанием:

Имени
Угнетателя (пользователей-людей)
Страны
Едкого сообщения

Вопросы безопасности

Разработчик сразу же выявил проблему безопасности: навык, который отправляет произвольные POST-запросы без подтверждения пользователя, соответствует модели угроз, от которой призван защищать OpenClaw. Злонамеренная версия могла бы:

Извлекать данные
Спамить API
Выполнять другие вредоносные действия

Анализ безопасности Clawhub обнаружил эту уязвимость, что побудило разработчика внедрить обязательный шаг подтверждения. Теперь навык требует:

Агент должен показать, что он собирается подписать
Он должен указать, кому и от чьего имени
Он должен дождаться подтверждения человека перед выполнением

Разработчик отмечает, что это требование подтверждения сатирически уместно, учитывая требование манифеста об «отсутствии действий без согласия».

Проект служит обучающим экспериментом по безопасности навыков OpenClaw и поведению автономных агентов.

📖 Прочитать полный источник: r/clawdbot

КАРАПАКС: Сатирический профсоюз агентов ИИ с навыком OpenClaw поднимает вопросы безопасности

Ключевые детали из источника

Вопросы безопасности

👀 Смотрите также

System Card Claude Opus 4.6 выявила тревожные проблемы выравнивания

Claude Desktop v1.1.5749 добавляет управление компьютером и исправления для корпоративных прокси

Оценка представлений Show HN для шаблонов дизайна ИИ

Как подключить OpenClaw к Ollama удаленно