Claude : 24 000 comptes pour extraire 16 M d'échanges

Anthropic a divulgué publiquement des détails sur une opération d'extraction de données à grande échelle ciblant Claude AI. Selon un post Reddit analysant la situation, il ne s'agissait pas d'une activité de recherche isolée mais d'un effort de niveau industriel impliquant plusieurs entreprises chinoises d'IA.

L'ampleur de la violation

L'opération impliquait trois acteurs spécifiques : DeepSeek, Moonshot AI et MiniMax. Ces laboratoires ont créé plus de 24 000 comptes frauduleux pour accéder à l'API de Claude. À travers ces comptes, ils ont extrait plus de 16 millions d'échanges de Claude pour entraîner leurs propres modèles.

Distinction entre distillation légitime et illicite

Le matériel source clarifie la différence entre les pratiques standards de l'industrie et ce qui s'est produit ici :

Distillation standard : Utiliser un grand modèle pour entraîner une version plus petite et plus efficace pour les clients commerciaux
Distillation illicite : Décrite comme un « blanchiment de capacités » - siphonner les garde-fous de sécurité et les structures logiques des modèles américains pour les injecter directement dans des systèmes militaires, de renseignement et de surveillance étrangers

Implications plus larges

Anthropic avertit que ces attaques deviennent plus sophistiquées et fréquentes. Le « système d'honneur » de l'utilisation des API semble insuffisant pour prévenir de telles opérations. L'entreprise appelle à des mesures défensives coordonnées entre les principaux acteurs de l'IA et les décideurs politiques.

La situation met en lumière la vulnérabilité des poids des modèles une fois qu'ils sont exposés via des points de terminaison d'API, même avec les protections existantes en place.

📖 Lire la source complète : r/ClaudeAI

Anthropic révèle une extraction de données à l'échelle industrielle de l'IA Claude par des laboratoires chinois.

L'ampleur de la violation

Distinction entre distillation légitime et illicite

Implications plus larges

👀 See Also

Règles de la Griffe : Ensemble de Règles de Sécurité Open Source pour les Agents OpenClaw

Compromission de NPM via une porte dérobée dans Axios : impact sur les agents de codage IA

PolyRange : Benchmark offensif résistant à la contamination par IA avec cibles générées par LLM

13 mots sur Reddit peuvent manipuler la recherche IA : recherche Cornell