Pesquisadores da U of T demonstram verme de IA que pode ser alimentado por modelos de peso aberto gratuitos

Pesquisadores do CleverHans Lab da Universidade de Toronto demonstraram uma nova classe de malware: um worm alimentado por IA que usa modelos de peso aberto publicamente acessíveis para adaptar sua estratégia de propagação em tempo real. Liderado por Nicolas Papernot, a equipe construiu um protótipo de prova de conceito em um laboratório digital seguro e fechado e publicou suas descobertas em 2 de junho de 2026. Acredita-se que o trabalho seja o primeiro a mostrar que modelos de IA pequenos e gratuitos – não sistemas caros e de ponta – podem alimentar worms capazes de assumir o controle de redes, sequestrar recursos computacionais e lançar ataques sofisticados praticamente sem custo.
Como Funciona
Worms tradicionais seguem um roteiro fixo programado por um humano. Se encontrarem uma defesa para a qual não foram projetados, falham. O worm de IA de Papernot quebra esse padrão. Ele usa um modelo de peso aberto gratuito (por exemplo, do crescente ecossistema de modelos baixáveis) para avaliar cada dispositivo alvo, identificar vulnerabilidades conhecidas e adaptar sua estratégia de ataque em tempo real. O worm se copia de dispositivo para dispositivo sem cliques ou conhecimento do usuário.
A equipe focou em modelos de peso aberto – modelos cujos pesos estão disponíveis gratuitamente – porque eles podem ser despojados de salvaguardas de segurança e ajustados para fins maliciosos. A comunidade de cibersegurança muitas vezes subestima essa ameaça, assumindo que modelos tão pequenos não têm poder para causar danos reais. A pesquisa da U of T refuta essa suposição.
Principais Implicações
- Sem necessidade de IA cara: O worm pode ser construído com modelos gratuitos e baixáveis que qualquer um pode modificar.
- Adaptação em tempo real: Diferente de worms programados, este worm de IA muda sua abordagem à medida que se espalha, explorando fraquezas específicas de dispositivos.
- Ampla superfície de ataque: Cada dispositivo online – de laptops a sistemas HVAC a controladores de rede elétrica – é um alvo em potencial.
- Defesas atuais são insuficientes: As proteções existentes são projetadas para worms estáticos e programados; ainda não estão prontas para variantes adaptativas impulsionadas por IA.
Divulgação Responsável
Antes de publicar, os pesquisadores compartilharam suas descobertas com órgãos nacionais de ciência, segurança e defesa para aconselhar sobre a divulgação responsável. A versão publicada foi cuidadosamente editada para remover qualquer informação que pudesse ajudar agentes de ameaças. Papernot afirmou: "A razão pela qual estamos fazendo esta pesquisa é garantir a segurança do ecossistema digital do qual todos dependemos – para manter as pessoas seguras."
Para Desenvolvedores e Equipes de Segurança
Esta pesquisa serve como um alerta precoce. Se você trabalha com cibersegurança, defesa de redes ou segurança de IA, este artigo deve informar seu modelo de ameaças. Espere que worms aumentados por IA se tornem uma ameaça prática mais cedo do que muitos antecipam. O trabalho da equipe posiciona a comunidade para desenvolver contramedidas de forma proativa.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Venda para os olhos: Um Plugin Que Impede o Código Claude de Ler Seus Arquivos .env
Blindfold é um novo plugin que impede o Claude Code de acessar valores secretos reais em arquivos .env mantendo-os no keychain do sistema operacional e usando espaços reservados como {{STRIPE_KEY}}, com ganchos que bloqueiam tentativas de acesso direto.

Análise de Segurança de Agentes de IA Revela Modelo de Confiança Comprometido e Altas Taxas de Vulnerabilidade
Uma análise de segurança de agentes de IA mostra que o modelo fundamental de confiança está quebrado, com 49% dos pacotes MCP apresentando problemas de segurança e a injeção indireta alcançando taxas de sucesso de ataque de 36-98% nos modelos mais avançados.

Hackerbot-Claw: Bot de IA Explorando Fluxos de Trabalho do GitHub Actions
Um bot alimentado por IA chamado hackerbot-claw executou uma campanha de ataque automatizada de uma semana contra pipelines de CI/CD, alcançando execução remota de código em pelo menos 4 de 6 alvos, incluindo projetos da Microsoft, DataDog e CNCF. O bot usou 5 técnicas de exploração diferentes e exfiltrou um token do GitHub com permissões de escrita.

Sandboxing de Agentes de IA com WebAssembly: Autoridade Zero por Padrão
Cosmonic argumenta que o sandboxing tradicional (seccomp, bubblewrap) falha para agentes de IA devido à autoridade ambiente. O modelo baseado em capacidades do WebAssembly concede autoridade zero por padrão, exigindo importações explícitas para sistema de arquivos, rede ou credenciais.