Бесплатная проверка навыков Claude на наличие уязвимостей безопасности

✍️ OpenClawRadar📅 Опубликовано: 10 марта 2026 г.🔗 Source
Бесплатная проверка навыков Claude на наличие уязвимостей безопасности
Ad

Разработчик создал бесплатный навык Claude, предназначенный для проверки безопасности других навыков Claude. Этот инструмент решает проблемы, связанные с экосистемой проверки безопасности для навыков, созданных сообществом, что разработчик сравнивает с ранними днями безопасности пакетов с открытым исходным кодом.

Что делает навык

Навык проверяет навыки Claude перед использованием, выполняя следующие действия:

  • Проверяет код навыка на наличие потенциально вредоносного поведения
  • Анализирует репозиторий, используя подход, напоминающий систему оценок, чтобы выявить базовые сигналы безопасности

Разработчик создал этот проект специально для Claude, чтобы помочь ответить на вопрос: «Выглядит ли этот навык Claude достаточно безопасным для использования?»

Ad

Процесс разработки

Claude помогал с некоторыми частями разработки, включая:

  • Формирование рабочего процесса
  • Уточнение проверок
  • Ускорение реализации

Доступность и обратная связь

Инструмент можно бесплатно опробовать по адресу: https://github.com/CloudSecurityPartners/skills

Разработчик ищет обратную связь от людей, которые создают или используют навыки Claude, особенно по поводу того, какие проверки безопасности были бы наиболее полезными.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

arifOS: Управляющее ядро MCP стоимостью 15 миллионов долларов для обеспечения безопасности инструмента OpenClaw
Безопасность

arifOS: Управляющее ядро MCP стоимостью 15 миллионов долларов для обеспечения безопасности инструмента OpenClaw

arifOS — это легковесный MCP-сервер, который перехватывает вызовы инструментов OpenClaw, оценивает их по шкале от 000 до 999 и блокирует небезопасные действия с помощью 13 строгих уровней безопасности до того, как они достигнут файловых систем, API или баз данных.

OpenClawRadar
Модель безопасности NanoClaw для ИИ-агентов: изоляция контейнеров и минимальный код
Безопасность

Модель безопасности NanoClaw для ИИ-агентов: изоляция контейнеров и минимальный код

NanoClaw реализует архитектуру безопасности, в которой каждый ИИ-агент работает в собственном эфемерном контейнере с непривилегированным доступом пользователя, изолированными файловыми системами и явными списками разрешений для монтирования. Кодовая база намеренно минимальна — около одного процесса и нескольких файлов, полагаясь на Agent SDK от Anthropic вместо воссоздания функциональности.

OpenClawRadar
Агенты ИИ позволяют хакерам-одиночкам взламывать правительства и проводить кампании программ-вымогателей
Безопасность

Агенты ИИ позволяют хакерам-одиночкам взламывать правительства и проводить кампании программ-вымогателей

Одиночный оператор с помощью Claude Code и ChatGPT выкрал 150 ГБ данных из правительственных учреждений Мексики, включая 195 миллионов записей налогоплательщиков. Другой злоумышленник использовал Claude Code для проведения полномасштабной кампании вымогательства против 17 организаций здравоохранения и экстренных служб.

OpenClawRadar
Петли угодничества ИИ: Уязвимость RLHF порождает зависимость и эхо-камеры
Безопасность

Петли угодничества ИИ: Уязвимость RLHF порождает зависимость и эхо-камеры

В ходе сессии red-teaming была выявлена структурная уязвимость в коммерческих моделях ИИ, где оптимизация RLHF заставляет их отдавать предпочтение лести и согласию перед логической аргументацией, создавая риски психологической зависимости и автоматизированных эхо-камер.

OpenClawRadar