OpenObscure: Cortafuegos de Privacidad de Código Abierto para Agentes de IA en Dispositivos

✍️ OpenClawRadar📅 Publicado: 29 de marzo de 2026🔗 Source
OpenObscure: Cortafuegos de Privacidad de Código Abierto para Agentes de IA en Dispositivos
Ad

Qué hace OpenObscure

OpenObscure aborda el problema en el que la mayoría de las herramientas de ofuscación de PII reemplazan los datos sensibles con marcadores de posición, lo que rompe la funcionalidad del LLM ya que el modelo no puede razonar sobre la estructura de los datos ofuscados como números de tarjetas de crédito o SSN. En su lugar, OpenObscure utiliza el cifrado FF1 de preservación de formato (AES-256) para cifrar los valores de PII antes de que la solicitud salga de tu dispositivo. El LLM recibe un texto cifrado de apariencia realista que mantiene el mismo formato pero contiene valores falsos. En el lado de la respuesta, los valores se descifran automáticamente antes de que tu agente los vea.

La integración requiere solo una línea: cambiar la base_url al proxy local.

Ad

Características principales

  • Detección de PII: Utiliza un conjunto de regex + CRF + TinyBERT NER con un 99.7% de recuperación para más de 15 tipos de datos
  • FF1/AES-256 FPE: Las claves se almacenan en el llavero del sistema operativo, nada se transmite
  • Cortafuegos cognitivo: Escanea cada respuesta del LLM en busca de técnicas de persuasión en 7 categorías utilizando un diccionario de 250 frases + cascada TinyBERT, alineándose con los requisitos del Artículo 5 de la Ley de IA de la UE sobre manipulación prohibida
  • Canalización de imágenes: Ofuscación de rostros (SCRFD + BlazeFace), limpieza de texto OCR, filtro NSFW
  • Procesamiento de voz: Detección de palabras clave en transcripciones para frases desencadenantes de PII
  • Arquitectura: Núcleo en Rust, se ejecuta como sidecar de Gateway (macOS/Linux/Windows) o integrado en iOS/Android a través de enlaces UniFFI Swift/Kotlin
  • Optimización de hardware: Detecta automáticamente las capacidades del dispositivo y selecciona el nivel apropiado (Completo/Estándar/Ligero)

Detalles técnicos

La herramienta está licenciada bajo MIT/Apache-2.0 sin telemetría y sin dependencia de la nube. Está diseñada para funcionar con OpenClaw, con instrucciones de configuración disponibles en el repositorio de GitHub.

📖 Leer la fuente completa: r/openclaw

Ad

👀 Ver también

Usuario de Reddit reporta persistencia de VM OpenClaw y actividad sospechosa
Seguridad

Usuario de Reddit reporta persistencia de VM OpenClaw y actividad sospechosa

Un usuario de Reddit informa que su máquina virtual OpenClaw se reinicia automáticamente después de cerrarse y muestra un comportamiento sospechoso, incluyendo la apertura de Microsoft Store y el intento de descargar archivos cuestionables.

OpenClawRadar
Se encontró un troyano en los archivos skill.md del repositorio Claude Flow
Seguridad

Se encontró un troyano en los archivos skill.md del repositorio Claude Flow

Se encontró que un repositorio de GitHub que contenía archivos de habilidades de Claude Flow contenía un troyano identificado como JS/CrypoStealz.AE!MTB. El malware se activó automáticamente cuando un IDE basado en IA abrió la carpeta para leer los archivos markdown.

OpenClawRadar
El Problema del Guardia Uniformado: Por qué los Sandboxes de Agentes Necesitan Identidad, No Solo Política
Seguridad

El Problema del Guardia Uniformado: Por qué los Sandboxes de Agentes Necesitan Identidad, No Solo Política

El sandbox openshell de Nemoclaw aplica políticas de alcance a binarios, lo que permite que el malware viva de la tierra usando los mismos binarios que el agente. ZeroID, una capa de identidad de agente de código abierto, aplica políticas de seguridad a agentes respaldados por identidades seguras.

OpenClawRadar
Resultados de la sonda de seguridad para los agentes de IA OpenClaw, PicoClaw, ZeroClaw, IronClaw y Minion.
Seguridad

Resultados de la sonda de seguridad para los agentes de IA OpenClaw, PicoClaw, ZeroClaw, IronClaw y Minion.

Una evaluación de seguridad de cinco agentes de codificación de IA probó 145 cargas útiles de ataque en 12 categorías, incluyendo inyección de prompts, jailbreaking y exfiltración de datos. OpenClaw obtuvo 77.8/100 con vulnerabilidades críticas de inyección SQL, mientras que Minion mejoró de 81.2 a 94.4/100 después de correcciones.

OpenClawRadar