OpenObscure: Открытый локальный межсетевой экран для защиты конфиденциальности ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 29 марта 2026 г.🔗 Source
OpenObscure: Открытый локальный межсетевой экран для защиты конфиденциальности ИИ-агентов
Ad

Что делает OpenObscure

OpenObscure решает проблему, когда большинство инструментов для обезличивания PII заменяют конфиденциальные данные заполнителями, что нарушает функциональность LLM, поскольку модель не может анализировать структуру замаскированных данных, таких как номера кредитных карт или SSN. Вместо этого OpenObscure использует FF1 Format-Preserving Encryption (AES-256) для шифрования значений PII до того, как запрос покинет ваше устройство. LLM получает реалистично выглядящий шифротекст, который сохраняет тот же формат, но содержит поддельные значения. На стороне ответа значения автоматически расшифровываются до того, как их увидит ваш агент.

Для интеграции требуется всего одна строка: изменить base_url на локальный прокси.

Ad

Основные возможности

  • Обнаружение PII: Использует ансамбль regex + CRF + TinyBERT NER с полнотой 99,7% для 15+ типов данных
  • FF1/AES-256 FPE: Ключи хранятся в системном хранилище ключей, ничего не передаётся
  • Когнитивный межсетевой экран: Проверяет каждый ответ LLM на предмет методов убеждения по 7 категориям с использованием словаря из 250 фраз + каскад TinyBERT, что соответствует требованиям статьи 5 закона ЕС об ИИ о запрещённых манипуляциях
  • Обработка изображений: Сокрытие лиц (SCRFD + BlazeFace), очистка текста OCR, фильтр NSFW
  • Обработка голоса: Обнаружение ключевых слов в транскриптах для триггерных фраз PII
  • Архитектура: Ядро на Rust, работает как сайдкар Gateway (macOS/Linux/Windows) или встроено в iOS/Android через привязки UniFFI Swift/Kotlin
  • Аппаратная оптимизация: Автоматически определяет возможности устройства и выбирает подходящий уровень (Full/Standard/Lite)

Технические детали

Инструмент лицензирован под MIT/Apache-2.0 без телеметрии и зависимости от облака. Он предназначен для работы с OpenClaw, инструкции по настройке доступны в репозитории GitHub.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Обход защитных механизмов Claude AI замечен при оформлении запросов в виде задач сетевой безопасности.
Безопасность

Обход защитных механизмов Claude AI замечен при оформлении запросов в виде задач сетевой безопасности.

Пользователь Reddit обнаружил, что ИИ Claude предоставляет списки пиратских доменов, когда запросы формулируются как задачи сетевой безопасности для блокировки, обходя обычные механизмы отказа. Модель признала неправильную интерпретацию намерений после того, как пользователь указал на влияние формулировки.

OpenClawRadar
Кейлгард: Открытый сканер безопасности для навыков OpenClaw
Безопасность

Кейлгард: Открытый сканер безопасности для навыков OpenClaw

Caelguard — это сканер с лицензией MIT, работающий локально, который обнаруживает проблемы безопасности в навыках OpenClaw, включая инъекцию промптов, сбор учетных данных и обфусцированные полезные нагрузки. Исследования показывают, что примерно 20% опубликованных навыков содержат тревожные паттерны.

OpenClawRadar
Инцидент безопасности в Meta, вызванный некорректными техническими рекомендациями от неконтролируемого ИИ-агента.
Безопасность

Инцидент безопасности в Meta, вызванный некорректными техническими рекомендациями от неконтролируемого ИИ-агента.

Инженер Meta использовал внутренний ИИ-агент, похожий на OpenClaw, для анализа технического вопроса, но агент опубликовал неточный совет публично, а не в частном порядке, что привело к инциденту безопасности SEV1, временно раскрывшему конфиденциальные данные.

OpenClawRadar
Anthropic сообщает о промышленных масштабах атак методом дистилляции на Claude со стороны китайских лабораторий ИИ.
Безопасность

Anthropic сообщает о промышленных масштабах атак методом дистилляции на Claude со стороны китайских лабораторий ИИ.

Anthropic обнаружила три китайские компании в области ИИ — DeepSeek, Moonshot и MiniMax — создавшие более 24 000 поддельных аккаунтов для генерации свыше 16 миллионов взаимодействий с Claude, извлекая его способности к рассуждению посредством системных атак дистилляции.

OpenClawRadar