Прокси-уровневая изоляция для обеспечения безопасности локальных API-ключей агента

Разработчик, экспериментирующий с локальными агентскими настройками (рабочие процессы в стиле Claude Code / Cursor), заметил, что большинство стеков раскрывают API-ключи через переменные окружения или файлы .env, создавая риски безопасности, когда любой инструмент, плагин или код, внедренный через промпт, потенциально может прочитать учетные данные.
Подход изоляции через прокси-слой
Вместо того чтобы предоставлять агентам реальные API-ключи во время выполнения, разработчик реализовал подход, при котором агенты видят только токены-заполнители. Небольшой локальный прокси заменяет эти токены на фактические учетные данные, когда запросы покидают процесс.
Это предотвращает попадание API-ключей в:
- Память агента
- Логи
- Контекстные окна
- Среды инструментов/плагинов
Техническая реализация
Настройка работает локально как единый Rust-бинарник и функционирует через HTTP_PROXY, позволяя вписаться в существующие рабочие процессы агентов без модификации фреймворков. Разработчик поделился репозиторием, чтобы другие могли изучить этот подход.
Разработчик спросил сообщество, как они решают проблему изолирования учетных данных в локальных агентских стеках, особенно при смешивании локальных моделей с периодическими API-вызовами к сервисам вроде OpenAI или Anthropic. Он конкретно поинтересовался, полагаются ли люди в основном на ограничение окружения и контейнеры или внедряют более структурные подходы вокруг границ секретов.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также
Безопасность ИИ-агентов: бюджет токенов определяет риск утечки данных
Разработчик протестировал ИИ-агентов, подключенных к Gmail: флагманские модели ловили фишинг, средние были нестабильны, дешевые молча пересылали вредоносные письма. Архитектурные защиты (изоляция, разрешения) не остановили ни одной атаки.

Лаборатория для атаки и защиты RAG с открытым исходным кодом для локальных стеков ChromaDB + LM Studio
Лаборатория с открытым исходным кодом измеряет эффективность отравления базы знаний RAG в стандартных локальных настройках с ChromaDB и LM Studio, показывая 95% успеха на незащищённых системах и оценивая практические методы защиты.

Функция использования компьютера от Anthropic вызывает блокировку управления в реальном тесте.
Anthropic внедрила возможности использования компьютера, и во время реализации механизмов управления сработал порог риска, который привёл к режиму БЛОКИРОВКИ, заблокировав все операции изменения, включая работу самого оператора по управлению.

Клод Код обнаруживает 23-летнюю уязвимость в ядре Linux
Исследователь Anthropic Николас Карлини использовал Claude Code для обнаружения нескольких удалённо эксплуатируемых переполнений буфера кучи в ядре Linux, включая одну, которая была скрыта в течение 23 лет. ИИ нашёл ошибки с минимальным контролем, просканировав всё дерево исходного кода ядра.