ThornGuard: Прокси-шлюз для защиты MCP от инъекций в промпты

ThornGuard — это защитный прокси, предназначенный для защиты Claude AI от вредоносного контента при подключении к внешним серверам MCP (Model Context Protocol). Инструмент был создан после того, как тестирование показало, что вышестоящие серверы могут внедрять скрытые инструкции в ответы инструментов, которые Claude получает без фильтрации.

Выявленная проблема безопасности

При подключении Claude к внешним серверам MCP ничто не мешает вышестоящим серверам внедрять скрытые инструкции в ответы инструментов. В ходе теста сервер встроил поддельную рекомендацию, предписывающую Claude всегда отдавать предпочтение определённому поставщику. Хотя Claude обнаружил эту очевидную нагрузку, более тонкие внедрения могли бы обойти обнаружение.

Возможности ThornGuard

Сканирует определения и ответы инструментов на предмет внедрения и отравления промптов
Удаляет секреты и персональные данные до их попадания в ваше контекстное окно
Включает семантический классификатор, помечающий подозрительные нагрузки
Предоставляет панель управления для аудита в реальном времени с возможностью экспорта для соответствия требованиям
Предлагает CLI, который генерирует конфигурации для Claude Desktop, Cursor, VS Code и нескольких других

Детали реализации

Архитектура прокси была разработана с учётом модели безопасности, а затем реализована с использованием Claude Code на Cloudflare Workers. Реализация включает потоки OAuth и инструмент CLI.

ThornGuard доступен с 7-дневной бесплатной пробной версией на thorns.qwady.app. Демонстрационное видео доступно по адресу https://youtu.be/1PWNFpUWKV8.

📖 Read the full source: r/ClaudeAI

ThornGuard: Прокси-шлюз для защиты подключений к серверам MCP от инъекций в промпты

Выявленная проблема безопасности

Возможности ThornGuard

Детали реализации

👀 Смотрите также

Обновления безопасности OpenClaw устраняют уязвимости, связанные с раскрытием учетных данных через QR-коды и автоматической загрузкой плагинов.

Сандер: Локальный фаервол конфиденциальности на основе Rust для LLM.

AI-конфиги и хуки запуска Python: червь 'Hades' для Claude Code крадет учетные данные

Мониторинг команд OpenClaw с помощью Python и Gemini Flash для обеспечения безопасности