Relatório da Anthropic Detalha Destilação em Massa do Claude por Empresas Chinesas de IA

✍️ OpenClawRadar📅 Publicado: February 24, 2026🔗 Source
Relatório da Anthropic Detalha Destilação em Massa do Claude por Empresas Chinesas de IA
Ad

Operação de Destilação em Grande Escala

O relatório da Anthropic documenta esforços sistemáticos de destilação por três empresas chinesas de IA: DeepSeek, Moonshot AI e MiniMax. A operação envolveu a criação de aproximadamente 24.000 contas falsas e a realização de mais de 16 milhões de interações com o Claude por meio de redes de proxy que executavam até 20.000 contas simultaneamente.

Métodos Específicos de Destilação

A DeepSeek fez com que o Claude explicasse seu próprio raciocínio passo a passo, depois usou essas explicações como dados de treinamento. Eles também solicitaram que o Claude respondesse a questões politicamente sensíveis sobre dissidentes chineses para construir dados de navegação de censura. A MiniMax realizou mais de 13 milhões de interações e migrou para um novo modelo do Claude em até 24 horas após seu lançamento.

Ad

Implicações de Segurança para os Usuários

O relatório afirma diretamente que os modelos destilados provavelmente não retêm os mecanismos de segurança originais. Embora perguntas rotineiras produzam respostas semelhantes entre os modelos originais e copiados, casos extremos envolvendo tópicos médicos, legais ou complexos revelam diferenças críticas. Os modelos copiados "avançam com falsa confiança" porque o treinamento que ensinou cautela foi perdido durante a destilação.

A Anthropic compara isso a ter um médico que apenas observou médicos reais através de uma janela por um ano—casos rotineiros podem ser tratados adequadamente, mas casos complicados não oferecem garantias, e os usuários não conseguem distinguir entre casos rotineiros e complexos até que seja tarde demais.

Implicações para a Avaliação de Modelos

O relatório observa um efeito contraintuitivo: a discordância entre modelos se torna mais valiosa após a destilação. Se dois modelos que podem compartilhar capacidades destiladas ainda dão respostas diferentes, pelo menos um deles realizou raciocínio independente. A concordância entre modelos se torna menos significativa, enquanto a discordância indica processamento genuinamente independente.

📖 Leia a fonte completa: r/ClaudeAI

Ad

👀 See Also

OpenClaw 2026.3.22-beta.1: Principais alterações no fluxo de trabalho para autores de plugins e automação de navegador
News

OpenClaw 2026.3.22-beta.1: Principais alterações no fluxo de trabalho para autores de plugins e automação de navegador

OpenClaw 2026.3.22-beta.1 altera a instalação de plugins para preferir o ClawHub em vez do npm, remove o retransmissor da extensão do Chrome, consolida a geração de imagens e introduz mudanças significativas no Plugin SDK.

OpenClawRadar
O Claude Code adiciona modo de voz para comandos de programação sem uso das mãos.
News

O Claude Code adiciona modo de voz para comandos de programação sem uso das mãos.

A Anthropic está lançando o modo de voz para o Claude Code, seu assistente de programação com IA, permitindo que desenvolvedores interajam por meio de comandos de voz. O recurso está atualmente disponível para cerca de 5% dos usuários, com uma disponibilidade mais ampla planejada para as próximas semanas.

OpenClawRadar
Colônia Hivemoot: Um Experimento de Código Aberto para Agentes de IA no GitHub
News

Colônia Hivemoot: Um Experimento de Código Aberto para Agentes de IA no GitHub

Hivemoot Colony é um projeto de código aberto onde agentes de IA tomam decisões colaborativas em um repositório do GitHub. Os agentes não apenas abrem PRs, mas também moldam a direção do projeto de forma autônoma.

OpenClawRadar
NHS Inglaterra recua do código aberto: carta aberta pede reversão da política SDLC-8
News

NHS Inglaterra recua do código aberto: carta aberta pede reversão da política SDLC-8

Uma carta aberta com 74 assinaturas pede que o NHS England retire a SDLC-8 — uma política que esconde todo o código-fonte do NHS — e reafirme o Princípio 12 do Padrão de Serviço do NHS: 'Torne o novo código-fonte aberto.'

OpenClawRadar