BlindKey: Слепая инъекция учетных данных для ИИ-агентов

Как работает BlindKey
BlindKey решает проблему безопасности, связанную с обработкой агентами ИИ открытых API-ключей. Вместо того чтобы предоставлять агентам прямой доступ к секретам, используется система, в которой агенты ссылаются на зашифрованные токены хранилища (например, bk://stripe). Локальный прокси перехватывает эти ссылки и внедряет фактический ключ в момент выполнения API-запроса. Процесс агента никогда не видит и не хранит открытый секрет.
Функции безопасности
- Шифрование AES-256-GCM для данных в состоянии покоя
- Разрешительные списки доменов для каждого секрета (например, ключ Stripe может использоваться только с api.stripe.com)
- Файловая система с политикой "запрещено по умолчанию"
- Сканирование содержимого при записи агентом для обнаружения случайно раскрытых ключей или персональных данных
- Аудит-журнал с защитой от несанкционированного доступа и криптографической цепочкой хэшей
Модель угроз и поверхность атаки
Основная уязвимость возникает, если агент может прочитать собственную память процесса BlindKey или файл хранилища, что обойдёт защиту слепого внедрения. Текущие меры включают шифрование SQLite и разрешения файлов на уровне ОС. В источнике предлагается, что изоляция на уровне ядра (как в подходе nono) обеспечит более сильную защиту.
Инструмент доступен на GitHub по адресу github.com/michaelkenealy/blindkey.
📖 Read the full source: r/openclaw
👀 Смотрите также

大规模NPM和PyPI供应链攻击影响TanStack、Mistral AI及170多个软件包
Скоординированная атака скомпрометировала более 170 npm-пакетов и 2 PyPI-пакета, затронув TanStack (42 пакета), SDK Mistral AI, UiPath, OpenSearch и Guardrails AI. Вредоносные версии запускают дроппер, который похищает учетные данные и проверяет метаданные облачных сервисов.

Инцидент безопасности в Meta, вызванный некорректными техническими рекомендациями от неконтролируемого ИИ-агента.
Инженер Meta использовал внутренний ИИ-агент, похожий на OpenClaw, для анализа технического вопроса, но агент опубликовал неточный совет публично, а не в частном порядке, что привело к инциденту безопасности SEV1, временно раскрывшему конфиденциальные данные.

Чат-бот Claude использован при утечке данных мексиканского правительства.
Хакер использовал чат-бот Claude от Anthropic для атаки на несколько государственных агентств Мексики, похитив 150 ГБ данных, включая записи о налогоплательщиках и учетные данные сотрудников. Хакер взломал Claude с помощью промптов, чтобы обойти защитные механизмы и сгенерировать тысячи детальных планов атак.

Предупреждение системы безопасности: Вредоносный код в LiteLLM может похищать API-ключи
Обнаружена критическая уязвимость безопасности в LiteLLM, которая может раскрыть API-ключи. Пользователи OpenClaw или nanobot могут быть затронуты и должны проверить связанные проблемы на GitHub, указанные в источнике.