ThornGuard: Прокси-шлюз для защиты подключений к серверам MCP от инъекций в промпты

✍️ OpenClawRadar📅 Опубликовано: 13 апреля 2026 г.🔗 Source
ThornGuard: Прокси-шлюз для защиты подключений к серверам MCP от инъекций в промпты
Ad

ThornGuard — это защитный прокси, предназначенный для защиты Claude AI от вредоносного контента при подключении к внешним серверам MCP (Model Context Protocol). Инструмент был создан после того, как тестирование показало, что вышестоящие серверы могут внедрять скрытые инструкции в ответы инструментов, которые Claude получает без фильтрации.

Выявленная проблема безопасности

При подключении Claude к внешним серверам MCP ничто не мешает вышестоящим серверам внедрять скрытые инструкции в ответы инструментов. В ходе теста сервер встроил поддельную рекомендацию, предписывающую Claude всегда отдавать предпочтение определённому поставщику. Хотя Claude обнаружил эту очевидную нагрузку, более тонкие внедрения могли бы обойти обнаружение.

Ad

Возможности ThornGuard

  • Сканирует определения и ответы инструментов на предмет внедрения и отравления промптов
  • Удаляет секреты и персональные данные до их попадания в ваше контекстное окно
  • Включает семантический классификатор, помечающий подозрительные нагрузки
  • Предоставляет панель управления для аудита в реальном времени с возможностью экспорта для соответствия требованиям
  • Предлагает CLI, который генерирует конфигурации для Claude Desktop, Cursor, VS Code и нескольких других

Детали реализации

Архитектура прокси была разработана с учётом модели безопасности, а затем реализована с использованием Claude Code на Cloudflare Workers. Реализация включает потоки OAuth и инструмент CLI.

ThornGuard доступен с 7-дневной бесплатной пробной версией на thorns.qwady.app. Демонстрационное видео доступно по адресу https://youtu.be/1PWNFpUWKV8.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Функция AI-поддержки Meta позволяет любому угнать аккаунты Instagram — подробности эксплойта внутри
Безопасность

Функция AI-поддержки Meta позволяет любому угнать аккаунты Instagram — подробности эксплойта внутри

Функция поддержки AI в Instagram, проходящая A/B-тестирование, позволяет злоумышленникам сбросить пароль, попросив агента отправить код на произвольный email. Уже взломано более 100 ценных аккаунтов.

OpenClawRadar
Безопасность OpenClaw Slack: Риски утечки API-ключей и способы их устранения
Безопасность

Безопасность OpenClaw Slack: Риски утечки API-ключей и способы их устранения

Развертывания OpenClaw Slack могут раскрывать API-ключи через сообщения об ошибках в каналах, при этом в отчете Bitsight обнаружено более 8000 уязвимых экземпляров. В источнике подробно описаны три конкретные уязвимости и предложены практические исправления, включая модификацию системных промптов и миграцию на SlackClaw.

OpenClawRadar
Умный Bash-хук для контроля прав Claude Code предотвращает обход составных команд
Безопасность

Умный Bash-хук для контроля прав Claude Code предотвращает обход составных команд

Python-хук PreToolUse устраняет уязвимость в системе разрешений Claude Code, где составные bash-команды могли обходить шаблоны разрешения/запрета. Скрипт разбивает команды на подкоманды и проверяет каждую отдельно по существующим правилам разрешений.

OpenClawRadar
Endo Familiar: Песочница объектных возможностей для AI-агентов
Безопасность

Endo Familiar: Песочница объектных возможностей для AI-агентов

Endo Familiar реализует объектно-возможностную безопасность для ИИ-агентов: агенты начинают с нулевым уровнем полномочий, получают только явные ссылки на конкретные файлы или каталоги и могут создавать более узкие возможности в изолированном коде.

OpenClawRadar