Relatório da Anthropic Detalha Destilação em Massa do Claude por Empresas Chinesas de IA

Operação de Destilação em Grande Escala
O relatório da Anthropic documenta esforços sistemáticos de destilação por três empresas chinesas de IA: DeepSeek, Moonshot AI e MiniMax. A operação envolveu a criação de aproximadamente 24.000 contas falsas e a realização de mais de 16 milhões de interações com o Claude por meio de redes de proxy que executavam até 20.000 contas simultaneamente.
Métodos Específicos de Destilação
A DeepSeek fez com que o Claude explicasse seu próprio raciocínio passo a passo, depois usou essas explicações como dados de treinamento. Eles também solicitaram que o Claude respondesse a questões politicamente sensíveis sobre dissidentes chineses para construir dados de navegação de censura. A MiniMax realizou mais de 13 milhões de interações e migrou para um novo modelo do Claude em até 24 horas após seu lançamento.
Implicações de Segurança para os Usuários
O relatório afirma diretamente que os modelos destilados provavelmente não retêm os mecanismos de segurança originais. Embora perguntas rotineiras produzam respostas semelhantes entre os modelos originais e copiados, casos extremos envolvendo tópicos médicos, legais ou complexos revelam diferenças críticas. Os modelos copiados "avançam com falsa confiança" porque o treinamento que ensinou cautela foi perdido durante a destilação.
A Anthropic compara isso a ter um médico que apenas observou médicos reais através de uma janela por um ano—casos rotineiros podem ser tratados adequadamente, mas casos complicados não oferecem garantias, e os usuários não conseguem distinguir entre casos rotineiros e complexos até que seja tarde demais.
Implicações para a Avaliação de Modelos
O relatório observa um efeito contraintuitivo: a discordância entre modelos se torna mais valiosa após a destilação. Se dois modelos que podem compartilhar capacidades destiladas ainda dão respostas diferentes, pelo menos um deles realizou raciocínio independente. A concordância entre modelos se torna menos significativa, enquanto a discordância indica processamento genuinamente independente.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

OpenClaw 2026.3.22-beta.1: Principais alterações no fluxo de trabalho para autores de plugins e automação de navegador
OpenClaw 2026.3.22-beta.1 altera a instalação de plugins para preferir o ClawHub em vez do npm, remove o retransmissor da extensão do Chrome, consolida a geração de imagens e introduz mudanças significativas no Plugin SDK.

O Claude Code adiciona modo de voz para comandos de programação sem uso das mãos.
A Anthropic está lançando o modo de voz para o Claude Code, seu assistente de programação com IA, permitindo que desenvolvedores interajam por meio de comandos de voz. O recurso está atualmente disponível para cerca de 5% dos usuários, com uma disponibilidade mais ampla planejada para as próximas semanas.

Colônia Hivemoot: Um Experimento de Código Aberto para Agentes de IA no GitHub
Hivemoot Colony é um projeto de código aberto onde agentes de IA tomam decisões colaborativas em um repositório do GitHub. Os agentes não apenas abrem PRs, mas também moldam a direção do projeto de forma autônoma.

NHS Inglaterra recua do código aberto: carta aberta pede reversão da política SDLC-8
Uma carta aberta com 74 assinaturas pede que o NHS England retire a SDLC-8 — uma política que esconde todo o código-fonte do NHS — e reafirme o Princípio 12 do Padrão de Serviço do NHS: 'Torne o novo código-fonte aberto.'