Señales de Audio Ocultas Secuestran Sistemas de Voz de IA con una Tasa de Éxito del 79-96%

✍️ OpenClawRadar📅 Publicado: 18 de mayo de 2026🔗 Source

Una nueva investigación presentada en el IEEE Symposium on Security and Privacy revela un vector de ataque práctico contra los Modelos de Lenguaje y Audio Grandes (LALM). Los atacantes pueden incrustar señales imperceptibles en clips de audio para secuestrar el comportamiento del modelo, logrando una tasa de éxito promedio del 79-96% en 13 modelos abiertos líderes, incluidos servicios comerciales de Microsoft y Mistral.

Cómo Funciona el Ataque

El clip de audio modificado es inaudible para el oído humano, pero desencadena que el modelo ejecute comandos ocultos. Fundamentalmente, el ataque funciona independientemente de las instrucciones que acompañe el usuario, haciendo que el mismo clip sea reutilizable contra el mismo modelo varias veces. Entrenar la señal adversarial toma aproximadamente 30 minutos.

Capacidades Explotadas

Los investigadores demostraron que los modelos comprometidos podían ser forzados a:

Realizar búsquedas web sensibles sin conocimiento del usuario
Descargar archivos desde fuentes controladas por el atacante
Enviar correos electrónicos con datos del usuario a direcciones externas

Modelos Afectados

El ataque fue validado contra 13 populares LALM de peso abierto, incluidas las API comerciales de voz AI. Esto resalta que los sistemas actuales de voz AI carecen de salvaguardas robustas contra perturbaciones adversariales de audio.

📖 Lee la fuente completa: HN AI Agents

👀 Ver también

Seguridad

Google informa que el hackeo impulsado por IA alcanzó escala industrial en 3 meses

El grupo de inteligencia de amenazas de Google descubrió que grupos criminales y estatales están utilizando modelos de IA comerciales (Gemini, Claude, OpenAI) para refinar y escalar ataques. Un grupo casi aprovechó un día cero para una explotación masiva, y otros están experimentando con el agente OpenClaw sin restricciones.

11 may 2026, 18:15 UTC

OpenClawRadar

Seguridad

Gancho Inteligente de Permisos de Bash para Claude Code Previene la Omisión de Comandos Compuestos

Un gancho PreToolUse de Python aborda una brecha de seguridad en el sistema de permisos de Claude Code, donde los comandos compuestos de bash podían eludir los patrones de permitir/denegar. El script descompone los comandos en subcomandos y verifica cada uno individualmente contra las reglas de permisos existentes.

18 mar 2026, 17:45 UTC

OpenClawRadar

Seguridad

BlindKey: Inyección de Credenciales Ciegas para Agentes de IA

BlindKey es una herramienta de seguridad que evita que los agentes de IA accedan a credenciales de API en texto plano mediante el uso de tokens de bóveda cifrados y un proxy local. Los agentes hacen referencia a tokens como bk://stripe, y el proxy inyecta la credencial real en el momento de la solicitud.

13 abr 2026, 17:45 UTC

OpenClawRadar

Seguridad

Por que las herramientas internas de RAG y doc-chat fallan en auditorias de seguridad

La comunidad discute bloqueadores reales de seguridad y cumplimiento que impiden que las herramientas RAG lleguen a produccion.

7 feb 2026, 20:31 UTC

OpenClaw Radar