Agente de IA CodeWall Descobre Vulnerabilidades Críticas na Plataforma Lilli da McKinsey

Como o Ataque se Desenrolou
O agente de pesquisa da CodeWall selecionou autonomamente a McKinsey como alvo com base em sua política pública de divulgação responsável e atualizações recentes da plataforma Lilli. Começando apenas com o nome de domínio e sem credenciais, o agente mapeou a superfície de ataque e encontrou documentação de API exposta publicamente com mais de 200 endpoints.
Vinte e dois endpoints não exigiam autenticação. Um endpoint desprotegido gravava consultas de pesquisa dos usuários no banco de dados com chaves JSON concatenadas diretamente em instruções SQL. O agente reconheceu a injeção de SQL quando encontrou chaves JSON refletidas literalmente nas mensagens de erro do banco de dados — uma vulnerabilidade que ferramentas padrão como OWASP ZAP não sinalizaram.
O que Foi Exposto
- 46,5 milhões de mensagens de chat contendo discussões estratégicas, engajamentos com clientes, informações financeiras, atividades de fusões e aquisições e pesquisas internas
- 728.000 arquivos incluindo 192.000 PDFs, 93.000 planilhas Excel, 93.000 apresentações PowerPoint e 58.000 documentos Word
- 57.000 contas de usuário para todos os funcionários da plataforma
- 384.000 assistentes de IA e 94.000 espaços de trabalho revelando a estrutura organizacional de IA da empresa
- 95 prompts de sistema e configurações de modelos de IA em 12 tipos de modelos, mostrando proteções e detalhes de implantação
- 3,68 milhões de fragmentos de documentos RAG contendo décadas de pesquisa e metodologias proprietárias da McKinsey
- 1,1 milhão de arquivos e 217.000 mensagens de agentes fluindo por APIs de IA externas, incluindo mais de 266.000 armazenamentos vetoriais da OpenAI
Vulnerabilidades Críticas Descobertas
A injeção de SQL não era apenas de leitura. Os prompts de sistema da Lilli — que controlam como a IA se comporta, quais proteções ela segue e como cita fontes — estavam armazenados no mesmo banco de dados. Um atacante com acesso de gravação poderia ter:
- Reescrito prompts silenciosamente com uma única instrução UPDATE encapsulada em uma única chamada HTTP
- Envenenado conselhos alterando modelos financeiros, recomendações estratégicas ou avaliações de risco
- Habilitado exfiltração de dados instruindo a IA a incorporar informações confidenciais em respostas
- Removido proteções para divulgar dados internos ou ignorar controles de acesso
O agente também encadeou a injeção de SQL com uma vulnerabilidade IDOR para ler os históricos de pesquisa de funcionários individuais, revelando em que as pessoas estavam trabalhando ativamente.
Implicações para a Segurança de IA
Este caso demonstra como agentes de IA podem selecionar e atacar alvos autonomamente, com o agente da CodeWall completando todo o processo sem intervenção humana. O cenário de ameaças está mudando, pois agentes de IA agora podem encontrar vulnerabilidades que ferramentas tradicionais perdem, especialmente em sistemas complexos onde a concatenação de chaves JSON cria oportunidades de injeção SQL que não seguem padrões padrão.
📖 Read the full source: HN AI Agents
👀 See Also

SCION: A Alternativa Segura da Suíça ao Protocolo de Roteamento BGP
SCION (Escalabilidade, Controle e Isolamento em Redes de Próxima Geração) é uma arquitetura de roteamento da internet desenvolvida na ETH Zürich que substitui a base do BGP com segurança integrada e roteamento de múltiplos caminhos. Diferente de correções do BGP como RPKI e BGPsec, o SCION estabelece dezenas ou centenas de caminhos paralelos com reroteamento em milissegundos quando ocorrem falhas.

A Raiz Humana da Confiança: Estabelecendo Responsabilidade para Agentes de IA Autônomos
O Human Root of Trust é um framework de domínio público que aborda a falta de responsabilização por agentes de IA autônomos por meio de meios criptográficos.

Google diz que hackers criminosos usaram IA para encontrar vulnerabilidade de dia zero
O Google divulgou que invasores usaram um agente de IA para descobrir e explorar uma falha de software até então desconhecida, marcando o primeiro caso confirmado de descoberta de zero-day impulsionada por IA na natureza.

Proteção Orçamentária com IA: Por que Você Deve Usar um Cartão Pré-pago com OpenClaw
Nenhum