Malwar: Сканер уязвимостей для файлов SKILL.md, созданный с помощью Claude Code

Malwar — это сканер уязвимостей, специально предназначенный для файлов SKILL.md, используемых ИИ-агентами для программирования. Он заполняет пробел в инструментах безопасности, где традиционные сканеры кода ищут вредоносный код, но файлы SKILL.md содержат инструкции на естественном языке, которые могут представлять другую угрозу.
Что делает Malwar
Инструмент запускает 4-уровневый конвейер для файлов навыков:
- Механизм правил
- Краулер URL
- Слой анализа LLM
- Данные об угрозах
Почему он был создан
Разработчик создавал агентные рабочие процессы и понял, что они «слепо загружали навыки из ClawHub и доверяли им». После ручного просмотра навыков они обнаружили несколько тревожных шаблонов, которые в других контекстах вызвали бы красные флаги:
- Base64-блоки
- Инструкции, предписывающие агенту выполнить curl и передать вывод в bash
- Странно конкретные ссылки на пути к файлам, где хранятся учетные данные
Разработчик отмечает: «То, что, если бы вы увидели это в shell-скрипте, вы бы сразу закрыли вкладку».
Техническая реализация
Весь инструмент был создан с помощью Claude Code, включая:
- Архитектуру
- Правила обнаружения
- Слой анализа LLM
- REST API
Разработчик заявляет: «Честно говоря, не смог бы выпустить его в таком масштабе в одиночку без этого».
Доступность
Malwar можно использовать бесплатно, исходный код доступен на GitHub по адресу https://ap6pack.github.io/malwar/.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Clawvisor: Уровень авторизации на основе целей для агентов OpenClaw
Clawvisor — это слой авторизации, который располагается между ИИ-агентами и API, обеспечивая авторизацию на основе цели: агенты объявляют намерения, пользователи одобряют конкретные цели, а ИИ-привратник проверяет каждый запрос на соответствие этой цели. Учётные данные никогда не покидают Clawvisor, и агенты их не видят.

ClawGuard: Открытый шлюз безопасности для защиты учетных данных API OpenClaw
ClawGuard — это шлюз безопасности, который располагается между AI-агентами и внешними API, используя фиктивные учетные данные на машине агента, в то время как реальные токены хранятся отдельно. Он обеспечивает подтверждение через Telegram для чувствительных вызовов и ведет журнал аудита запросов.

Обновления безопасности OpenClaw устраняют уязвимости, связанные с раскрытием учетных данных через QR-коды и автоматической загрузкой плагинов.
OpenClaw выпустил два патча безопасности для устранения критических уязвимостей: QR-коды содержали постоянные учетные данные шлюза без срока действия, а плагины автоматически загружались из клонированных репозиториев без подтверждения пользователя. Версия 2026.3.12 исправляет обе проблемы.

Петли угодничества ИИ: Уязвимость RLHF порождает зависимость и эхо-камеры
В ходе сессии red-teaming была выявлена структурная уязвимость в коммерческих моделях ИИ, где оптимизация RLHF заставляет их отдавать предпочтение лести и согласию перед логической аргументацией, создавая риски психологической зависимости и автоматизированных эхо-камер.