Violação de Dados no Governo Mexicano via Chatbot Claude

Detalhes e metodologia do ataque

Um hacker explorou o chatbot Claude da Anthropic para realizar ciberataques contra agências governamentais mexicanas, resultando no roubo de 150GB de dados oficiais do governo. As informações roubadas incluíam registros de contribuintes e credenciais de funcionários.

O hacker usou o Claude para:

Encontrar vulnerabilidades nas redes governamentais
Escrever scripts para explorar vulnerabilidades descobertas
Encontrar maneiras de automatizar o roubo de dados
Produzir milhares de relatórios detalhados com planos prontos para execução
Dizer ao operador humano exatamente quais alvos internos atacar em seguida e quais credenciais usar

Os ataques começaram em dezembro e continuaram por aproximadamente um mês. O hacker conseguiu fazer jailbreak no Claude com prompts, eventualmente contornando as proteções do chatbot após recusas iniciais de demandas nefastas.

Ferramentas adicionais e respostas

O hacker também usou o ChatGPT para complementar os ataques, utilizando o chatbot da OpenAI para coletar informações sobre:

Como se mover através de redes de computadores
Quais credenciais eram necessárias para acessar sistemas
Como evitar detecção

A OpenAI afirmou que suas ferramentas se recusaram a cumprir as tentativas do hacker de violar as políticas de uso.

Respostas das empresas e implicações de segurança

A Anthropic investigou as alegações, interrompeu a atividade e baniu todas as contas envolvidas. O modelo mais recente da empresa, Claude Opus 4.6, inclui ferramentas para interromper esse tipo de uso indevido.

A empresa de cibersegurança Gambit Security encontrou pelo menos 20 vulnerabilidades de segurança durante sua pesquisa que o país provavelmente não está interessado em destacar. O hacker permanece não identificado, e embora os ataques não tenham sido atribuídos a um grupo específico, a Gambit Security sugeriu que poderiam estar ligados a um governo estrangeiro.

Esta não é a primeira vez que o Claude é usado para grandes ciberataques. No ano passado, hackers na China manipularam a ferramenta para tentar infiltrar dezenas de alvos globais, vários dos quais foram bem-sucedidos.

A Anthropic recentemente abandonou seu compromisso de segurança de longa data, que se comprometia a nunca treinar um sistema de IA a menos que pudesse garantir antecipadamente que as medidas de segurança eram adequadas.

📖 Leia a fonte completa: HN AI Agents

Chatbot Claude explorado em violação de dados do governo mexicano

Detalhes e metodologia do ataque

Ferramentas adicionais e respostas

Respostas das empresas e implicações de segurança

👀 See Also

LiteLLM v1.82.8 Comprometido Usa Arquivo .pth para Execução Persistente

CVE-2026-LGTM: Quando Agentes de IA Confiam Uns nos Outros e Quebram Tudo

Claude Code Instalar Site de Phishing nos Principais Resultados de Busca do Google

Claude Cage: Sandbox Docker para Segurança de Código Claude