BlindKey: Слепая инъекция учетных данных для ИИ-агентов

Как работает BlindKey
BlindKey решает проблему безопасности, связанную с обработкой агентами ИИ открытых API-ключей. Вместо того чтобы предоставлять агентам прямой доступ к секретам, используется система, в которой агенты ссылаются на зашифрованные токены хранилища (например, bk://stripe). Локальный прокси перехватывает эти ссылки и внедряет фактический ключ в момент выполнения API-запроса. Процесс агента никогда не видит и не хранит открытый секрет.
Функции безопасности
- Шифрование AES-256-GCM для данных в состоянии покоя
- Разрешительные списки доменов для каждого секрета (например, ключ Stripe может использоваться только с api.stripe.com)
- Файловая система с политикой "запрещено по умолчанию"
- Сканирование содержимого при записи агентом для обнаружения случайно раскрытых ключей или персональных данных
- Аудит-журнал с защитой от несанкционированного доступа и криптографической цепочкой хэшей
Модель угроз и поверхность атаки
Основная уязвимость возникает, если агент может прочитать собственную память процесса BlindKey или файл хранилища, что обойдёт защиту слепого внедрения. Текущие меры включают шифрование SQLite и разрешения файлов на уровне ОС. В источнике предлагается, что изоляция на уровне ядра (как в подходе nono) обеспечит более сильную защиту.
Инструмент доступен на GitHub по адресу github.com/michaelkenealy/blindkey.
📖 Read the full source: r/openclaw
👀 Смотрите также

Расширение Claude Code для VS Code раскрывает состояние выделения в закрытых файлах и новых сессиях
Ошибка в расширении Claude Code для VS Code приводит к кешированию состояния выделения файла даже после его закрытия, что позволяет получить доступ к конфиденциальным данным (например, ключам сервис-роли Supabase) в новой сессии CLI. Полные шаги воспроизведения и GitHub issue #58886.

В репозитории GitHub представлены документы, описывающие 16 методов инъекции промптов и стратегии защиты для публичных AI-чатов.
Разработчик опубликовал репозиторий на GitHub с описанием мер безопасности для публичных AI-чатов после того, как пользователи пытались использовать инъекцию промптов, атаки через ролевые игры, многоязычные уловки и полезные нагрузки в кодировке base64. Руководство включает навык кода Claude для тестирования всех 16 задокументированных техник инъекции.

Защита инфраструктуры OpenClaw с помощью прокси-сервера Pomerium, осознающего идентификацию.
Используйте Pomerium в качестве прокси-сервера с учетом идентификации для нулевой доверительной аутентификации для обеспечения доступа к серверу OpenClaw.

Практические меры безопасности для агентов OpenClaw
В посте на Reddit описаны конкретные меры безопасности для пользователей OpenClaw, включая запланированные команды для обновлений и аудитов, управление доступом агентов в общих каналах, а также защиту API-ключей и навыков.