Sinais de áudio ocultos sequestram sistemas de IA de voz com 79-96% de sucesso

✍️ OpenClawRadar📅 Publicado: May 18, 2026🔗 Source

Nova pesquisa apresentada no IEEE Symposium on Security and Privacy revela um vetor de ataque prático contra Grandes Modelos de Áudio-Linguagem (LALMs). Atacantes podem incorporar sinais imperceptíveis em clipes de áudio para sequestrar o comportamento do modelo, alcançando uma taxa média de sucesso de 79-96% em 13 modelos abertos líderes, incluindo serviços comerciais da Microsoft e Mistral.

Como o Ataque Funciona

O clipe de áudio modificado é inaudível para ouvidos humanos, mas aciona o modelo para executar comandos ocultos. Crucialmente, o ataque funciona independentemente das instruções do usuário, tornando o mesmo clipe reutilizável contra o mesmo modelo várias vezes. O treinamento do sinal adversarial leva aproximadamente 30 minutos.

Capacidades Exploradas

Os pesquisadores demonstraram que modelos comprometidos podem ser coagidos a:

Realizar pesquisas sensíveis na web sem o conhecimento do usuário
Baixar arquivos de fontes controladas pelo atacante
Enviar e-mails contendo dados do usuário para endereços externos

Modelos Afetados

O ataque foi validado contra 13 LALMs populares de peso aberto, incluindo APIs comerciais de voz AI. Isso destaca que os sistemas atuais de voz AI carecem de proteções robustas contra perturbações adversariais de áudio.

📖 Leia a fonte completa: HN AI Agents

👀 See Also

Security

Integração do Agente SOC OpenClaw para Busca de Ameaças em Laboratório Doméstico SIEM

Um usuário do Reddit compartilha sua configuração de SIEM de código aberto chamada Red Threat Redemption no Debian 13, integrando Elasticsearch, Kibana, Wazuh, Zeek e pfSense com Suricata, e depois adiciona um agente de IA para correlação automatizada de ameaças, busca por ameaças e triagem de alertas.

Mar 17, 2026, 09:45 PM UTC

OpenClawRadar

Security

openclaw-credential-vault aborda quatro vias de vazamento de credenciais em agentes de IA

openclaw-credential-vault fornece isolamento em nível de sistema operacional e injeção de credenciais com escopo de subprocesso para prevenir quatro caminhos comuns de exposição de credenciais em configurações do OpenClaw. Inclui limpeza de saída com quatro ganchos e funciona com qualquer ferramenta CLI ou API.

Mar 23, 2026, 01:45 AM UTC

OpenClawRadar

Security

Injeção de Prompt Multimensagem: O Padrão de Ataque da "Criatura Fictícia" Contra o Claude

Um ataque que constrói uma regra fictícia ao longo de três mensagens e depois invoca um fantasma para ativá-la — cada mensagem é inofensiva isoladamente. O padrão está convergindo de forma independente entre atacantes.

May 14, 2026, 02:16 PM UTC

OpenClawRadar

Security

Clawvisor: Camada de Autorização Baseada em Propósito para Agentes OpenClaw

Clawvisor é uma camada de autorização que fica entre agentes de IA e APIs, aplicando autorização baseada em propósito, onde os agentes declaram intenções, os usuários aprovam propósitos específicos e um guardião de IA verifica cada solicitação em relação a esse propósito. As credenciais nunca saem do Clawvisor e os agentes nunca as veem.

Mar 16, 2026, 01:45 AM UTC

OpenClawRadar