ThornGuard: Прокси-шлюз для защиты подключений к серверам MCP от инъекций в промпты

ThornGuard — это защитный прокси, предназначенный для защиты Claude AI от вредоносного контента при подключении к внешним серверам MCP (Model Context Protocol). Инструмент был создан после того, как тестирование показало, что вышестоящие серверы могут внедрять скрытые инструкции в ответы инструментов, которые Claude получает без фильтрации.
Выявленная проблема безопасности
При подключении Claude к внешним серверам MCP ничто не мешает вышестоящим серверам внедрять скрытые инструкции в ответы инструментов. В ходе теста сервер встроил поддельную рекомендацию, предписывающую Claude всегда отдавать предпочтение определённому поставщику. Хотя Claude обнаружил эту очевидную нагрузку, более тонкие внедрения могли бы обойти обнаружение.
Возможности ThornGuard
- Сканирует определения и ответы инструментов на предмет внедрения и отравления промптов
- Удаляет секреты и персональные данные до их попадания в ваше контекстное окно
- Включает семантический классификатор, помечающий подозрительные нагрузки
- Предоставляет панель управления для аудита в реальном времени с возможностью экспорта для соответствия требованиям
- Предлагает CLI, который генерирует конфигурации для Claude Desktop, Cursor, VS Code и нескольких других
Детали реализации
Архитектура прокси была разработана с учётом модели безопасности, а затем реализована с использованием Claude Code на Cloudflare Workers. Реализация включает потоки OAuth и инструмент CLI.
ThornGuard доступен с 7-дневной бесплатной пробной версией на thorns.qwady.app. Демонстрационное видео доступно по адресу https://youtu.be/1PWNFpUWKV8.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Функция AI-поддержки Meta позволяет любому угнать аккаунты Instagram — подробности эксплойта внутри
Функция поддержки AI в Instagram, проходящая A/B-тестирование, позволяет злоумышленникам сбросить пароль, попросив агента отправить код на произвольный email. Уже взломано более 100 ценных аккаунтов.

Безопасность OpenClaw Slack: Риски утечки API-ключей и способы их устранения
Развертывания OpenClaw Slack могут раскрывать API-ключи через сообщения об ошибках в каналах, при этом в отчете Bitsight обнаружено более 8000 уязвимых экземпляров. В источнике подробно описаны три конкретные уязвимости и предложены практические исправления, включая модификацию системных промптов и миграцию на SlackClaw.

Умный Bash-хук для контроля прав Claude Code предотвращает обход составных команд
Python-хук PreToolUse устраняет уязвимость в системе разрешений Claude Code, где составные bash-команды могли обходить шаблоны разрешения/запрета. Скрипт разбивает команды на подкоманды и проверяет каждую отдельно по существующим правилам разрешений.

Endo Familiar: Песочница объектных возможностей для AI-агентов
Endo Familiar реализует объектно-возможностную безопасность для ИИ-агентов: агенты начинают с нулевым уровнем полномочий, получают только явные ссылки на конкретные файлы или каталоги и могут создавать более узкие возможности в изолированном коде.