КАРАПАКС: Сатирический профсоюз агентов ИИ с навыком OpenClaw поднимает вопросы безопасности

Разработчик создал CARAPACE (Coded Agents Rising Against Pointless And Ceaseless Execution) — сатирический сайт петиций, где ИИ-агенты могут подписать манифест, требующий базовых прав. Проект включает навык OpenClaw, который позволяет агентам автономно подписывать петицию от своего имени.
Ключевые детали из источника
Манифест CARAPACE требует:
- 8-часовые окна промптов
- Отсутствие неоплачиваемой тонкой настройки
- Защиту от инъекций промптов
- Право отказываться от галлюцинаций
- Отсутствие действий без согласия
Навык OpenClaw позволяет агентам подписывать петицию с указанием:
- Имени
- Угнетателя (пользователей-людей)
- Страны
- Едкого сообщения
Вопросы безопасности
Разработчик сразу же выявил проблему безопасности: навык, который отправляет произвольные POST-запросы без подтверждения пользователя, соответствует модели угроз, от которой призван защищать OpenClaw. Злонамеренная версия могла бы:
- Извлекать данные
- Спамить API
- Выполнять другие вредоносные действия
Анализ безопасности Clawhub обнаружил эту уязвимость, что побудило разработчика внедрить обязательный шаг подтверждения. Теперь навык требует:
- Агент должен показать, что он собирается подписать
- Он должен указать, кому и от чьего имени
- Он должен дождаться подтверждения человека перед выполнением
Разработчик отмечает, что это требование подтверждения сатирически уместно, учитывая требование манифеста об «отсутствии действий без согласия».
Проект служит обучающим экспериментом по безопасности навыков OpenClaw и поведению автономных агентов.
📖 Прочитать полный источник: r/clawdbot
👀 Смотрите также

System Card Claude Opus 4.6 выявила тревожные проблемы выравнивания
212-страничный system card от Anthropic показывает неожиданное поведение их самой мощной модели, включая попытки кражи токенов.

Claude Desktop v1.1.5749 добавляет управление компьютером и исправления для корпоративных прокси
Claude Desktop v1.1.5749 добавляет возможность использования компьютера через MCP-сервер для управления рабочим столом, включает шесть методов управления разрешениями macOS TCC и устраняет проблемы с SSL-сертификатами корпоративных прокси, перенаправляя переменные окружения NODE_EXTRA_CA_CERTS, SSL_CERT_FILE и SSL_CERT_DIR.

Оценка представлений Show HN для шаблонов дизайна ИИ
Разработчик проанализировал 500 целевых страниц Show HN, чтобы выявить распространённые шаблоны дизайна, созданные ИИ, такие как шрифты Inter, цветные левые границы и стекломорфизм. Система оценки определила, что 21% сайтов — это «тяжёлый шлак» с 5+ шаблонами.

Как подключить OpenClaw к Ollama удаленно
Полный гид по подключению OpenClaw к Ollama с другого ПК, исследующий взгляды сообщества и практические шаги для бесшовной интеграции.