BlindKey: Inyección de Credenciales Ciegas para Agentes de IA

✍️ OpenClawRadar📅 Publicado: 13 de abril de 2026🔗 Source
BlindKey: Inyección de Credenciales Ciegas para Agentes de IA
Ad

Cómo funciona BlindKey

BlindKey aborda el riesgo de seguridad de que los agentes de IA manejen credenciales de API en texto plano. En lugar de dar a los agentes acceso directo a los secretos, utiliza un sistema en el que los agentes hacen referencia a tokens de bóveda cifrados (por ejemplo, bk://stripe). Un proxy local intercepta estas referencias e inyecta la credencial real en el momento en que se realiza la solicitud de la API. El proceso del agente nunca ve ni almacena el secreto en texto plano.

Características de seguridad

  • Cifrado AES-256-GCM para datos en reposo
  • Lista de dominios permitidos por secreto (por ejemplo, una clave de Stripe solo se puede usar con api.stripe.com)
  • Control de acceso al sistema de archivos con denegación por defecto
  • Escaneo de contenido en las escrituras del agente para detectar credenciales o información personal identificable (PII) filtradas accidentalmente
  • Registro de auditoría resistente a manipulaciones con cadena de hashes criptográficos
Ad

Modelo de amenazas y superficie de ataque

La principal vulnerabilidad identificada es si un agente puede leer la memoria del propio proceso de BlindKey o su archivo de bóveda, lo que eludiría la protección de inyección ciega. Las mitigaciones actuales incluyen cifrado de SQLite y permisos de archivo a nivel del sistema operativo. La fuente sugiere que el aislamiento a nivel de kernel (como el enfoque de nono) proporcionaría una protección más sólida.

La herramienta está disponible en GitHub en github.com/michaelkenealy/blindkey.

📖 Read the full source: r/openclaw

Ad

👀 Ver también

El repositorio de GitHub documenta 16 técnicas de inyección de prompts y estrategias de defensa para chats públicos de IA.
Seguridad

El repositorio de GitHub documenta 16 técnicas de inyección de prompts y estrategias de defensa para chats públicos de IA.

Un desarrollador publicó un repositorio en GitHub que detalla medidas de seguridad para chatbots de IA públicos después de que usuarios intentaran inyección de prompts, ataques de roleplay, trucos multilingües y payloads codificados en base64. La guía incluye una habilidad de código de Claude para probar las 16 técnicas de inyección documentadas.

OpenClawRadar
Escaneo Gratuito de Habilidades de Claude para Detectar Riesgos de Seguridad en Otras Habilidades
Seguridad

Escaneo Gratuito de Habilidades de Claude para Detectar Riesgos de Seguridad en Otras Habilidades

Un desarrollador ha creado una habilidad gratuita de Claude que revisa la seguridad de otras habilidades de Claude, verificando el código en busca de comportamientos potencialmente maliciosos y analizando repositorios con un enfoque de tarjeta de puntuación. La herramienta ayuda a responder si una habilidad de Claude parece razonablemente segura de usar.

OpenClawRadar
Desarrollador Construye Sandbox de MicroVM Firecracker para OpenClaw Security
Seguridad

Desarrollador Construye Sandbox de MicroVM Firecracker para OpenClaw Security

Un desarrollador preocupado por la seguridad de los LLM construyó un sandbox de hardware dedicado utilizando microVMs Firecracker para aislar scripts de OpenClaw, donde cada script se ejecuta en su propio kernel de Linux con un límite de 128 MB de RAM y sin red por defecto.

OpenClawRadar
Usando FastAPI Guard para proteger las instancias de OpenClaw contra ataques.
Seguridad

Usando FastAPI Guard para proteger las instancias de OpenClaw contra ataques.

FastAPI Guard proporciona middleware que añade 17 comprobaciones de seguridad, incluyendo filtrado de IP, bloqueo geográfico, limitación de tasa y detección de penetración. La herramienta bloquea ataques como los documentados en las auditorías de seguridad de OpenClaw, que muestran 512 vulnerabilidades y más de 40,000 instancias expuestas.

OpenClawRadar