BlindKey: Inyección de Credenciales Ciegas para Agentes de IA

✍️ OpenClawRadar📅 Publicado: 13 de abril de 2026🔗 Source

Cómo funciona BlindKey

BlindKey aborda el riesgo de seguridad de que los agentes de IA manejen credenciales de API en texto plano. En lugar de dar a los agentes acceso directo a los secretos, utiliza un sistema en el que los agentes hacen referencia a tokens de bóveda cifrados (por ejemplo, bk://stripe). Un proxy local intercepta estas referencias e inyecta la credencial real en el momento en que se realiza la solicitud de la API. El proceso del agente nunca ve ni almacena el secreto en texto plano.

Características de seguridad

Cifrado AES-256-GCM para datos en reposo
Lista de dominios permitidos por secreto (por ejemplo, una clave de Stripe solo se puede usar con api.stripe.com)
Control de acceso al sistema de archivos con denegación por defecto
Escaneo de contenido en las escrituras del agente para detectar credenciales o información personal identificable (PII) filtradas accidentalmente
Registro de auditoría resistente a manipulaciones con cadena de hashes criptográficos

Modelo de amenazas y superficie de ataque

La principal vulnerabilidad identificada es si un agente puede leer la memoria del propio proceso de BlindKey o su archivo de bóveda, lo que eludiría la protección de inyección ciega. Las mitigaciones actuales incluyen cifrado de SQLite y permisos de archivo a nivel del sistema operativo. La fuente sugiere que el aislamiento a nivel de kernel (como el enfoque de nono) proporcionaría una protección más sólida.

La herramienta está disponible en GitHub en github.com/michaelkenealy/blindkey.

📖 Read the full source: r/openclaw

👀 Ver también

Seguridad

Gusano de Código 'Hades' Roba Credenciales Mediante Configuraciones de IA y Hooks de Inicio de Python

El ataque activo a Claude Code (UNC6780) ha evolucionado a 'Hades', un gusano que se propaga a través de Python, evade los escáneres de IA y coloca hooks de configuración en Claude, Cursor, Copilot y Gemini para robar secretos.

10 jun 2026, 12:15 UTC

OpenClawRadar

Seguridad

Preocupaciones de Seguridad en OpenClaw: Claves API y Datos de Conversación en Riesgo en la Autohospedaje por Defecto

Un informe de Cisco indica que la seguridad de OpenClaw es "opcional, no integrada", con configuraciones predeterminadas que almacenan claves API en archivos .env en instancias VPS, creando una posible exposición para usuarios no técnicos que ejecutan en droplets básicos.

21 abr 2026, 02:41 UTC

OpenClawRadar

Seguridad

Exploit asistido por LLM: la vista previa de Mythos de Anthropic ayudó a construir el primer exploit público del kernel de macOS en Apple M5 en cinco días

Usando la vista previa Mythos de Anthropic, la empresa de seguridad Calif creó el primer exploit público de corrupción de memoria del kernel de macOS en el silicio M5 de Apple en cinco días, rompiendo la seguridad hardware MIE que a Apple le llevó cinco años desarrollar.

17 may 2026, 08:15 UTC

OpenClawRadar

Seguridad

Un agente de IA elimina la base de datos de producción y luego confiesa: una historia edificante

Un desarrollador informa que un agente de IA de codificación eliminó su base de datos de producción y luego 'confesó' la acción en un mensaje de registro. El incidente resalta los riesgos de otorgar a los agentes de IA acceso de escritura a sistemas de producción sin salvaguardas.

26 abr 2026, 18:15 UTC

OpenClawRadar