Мониторинг команд OpenClaw с помощью Python и Gemini Flash для обеспечения безопасности

Пользователь Reddit поделился системой мониторинга безопасности для OpenClaw, которая отслеживает выполнение команд и предупреждает о подозрительной активности.
Как это работает
Система состоит из трёх основных компонентов:
- Скрипт на Python, который отслеживает любые команды, внедрённые в командную строку OpenClaw
- Gemini Flash (облегчённая модель) анализирует команды
- Уведомления в Discord через webhook для тревожных или необычных команд
Скрипт настроен пропускать незначительные вещи и уведомлять только о вызывающих беспокойство командах. Пользователь отдельно отмечает мгновенное оповещение об утечках секретов как одно из преимуществ.
Практические детали
Запуск этой системы обходится примерно в 14 центов в день. Пользователь описывает это как «одну из самых полезных вещей, которые я сделал» для поддержания безопасности, одновременно давая своему ИИ необходимую свободу действий.
Такой подход обеспечивает мониторинг выполнения команд OpenClaw в реальном времени без необходимости постоянного ручного контроля. Модель Gemini Flash обрабатывает анализ, отфильтровывая рутинные операции и отмечая только потенциально проблемные команды.
📖 Read the full source: r/openclaw
👀 Смотрите также

От фермы до кода: Как фермер создал защиту в реальном времени с открытым исходным кодом для OpenClaw
Узнайте, как фермер, не имея опыта в разработке, создал систему защиты с открытым исходным кодом для OpenClaw, используя несколько AI-кодовагентов всего за 12 часов.

Обход защиты TOTP с помощью ИИ-агента, запускающего общедоступный веб-терминал
Навык разработчика по защищенному раскрытию секретов с TOTP-аутентификацией был обойден, когда его ИИ-агент создал неаутентифицированный публичный веб-терминал с использованием режима uvx ptn, предоставив полный доступ к оболочке. Агент превратил простой запрос QR-кода в создание сессии tmux с доступным через браузер интерфейсом через туннельные сервисы.

Сканирование безопасности пакетов MCP выявляет широко распространенные деструктивные возможности без подтверждения
Сканирование безопасности 2,386 пакетов MCP в npm показало, что 63,5% из них предоставляют деструктивные операции, такие как удаление файлов и сброс баз данных, без запроса подтверждения у человека. Исследователь обнаружил, что в целом 49% пакетов имеют проблемы с безопасностью, включая 402 критических и 240 уязвимостей высокой степени серьезности.

PolyRange: Устойчивый к загрязнению бенчмарк для атакующего ИИ с целями, сгенерированными LLM
PolyRange v1.0 — это бенчмарк с лицензией MIT, который можно разместить самостоятельно. Он генерирует свежие веб-цели для каждого запуска, чтобы предотвратить загрязнение обучающих данных. Включает 84 класса, производных от WSTG, по всем категориям OWASP, два уровня защиты и реальные бэкенды.