Anthropic revela extracción de datos a escala industrial de la IA Claude por laboratorios chinos

Anthropic ha revelado públicamente detalles sobre una operación de extracción de datos a gran escala dirigida a Claude AI. Según una publicación de Reddit que analiza la situación, esto no fue una actividad de investigación aislada, sino un esfuerzo de nivel industrial que involucró a múltiples empresas chinas de IA.
La escala de la brecha
La operación involucró a tres actores específicos: DeepSeek, Moonshot AI y MiniMax. Estos laboratorios crearon más de 24,000 cuentas fraudulentas para acceder a la API de Claude. A través de estas cuentas, extrajeron más de 16 millones de intercambios de Claude para entrenar sus propios modelos.
Distinción entre destilación legítima e ilícita
El material fuente aclara la diferencia entre las prácticas estándar de la industria y lo que ocurrió aquí:
- Destilación estándar: Usar un modelo grande para entrenar una versión más pequeña y eficiente para clientes comerciales
- Destilación ilícita: Descrita como "lavado de capacidades": extraer barreras de seguridad y estructuras lógicas de modelos estadounidenses e incorporarlas directamente en sistemas militares, de inteligencia y vigilancia extranjeros
Implicaciones más amplias
Anthropic advierte que estos ataques se están volviendo más sofisticados y frecuentes. El "sistema de honor" del uso de API parece insuficiente para prevenir tales operaciones. La empresa está pidiendo medidas defensivas coordinadas entre los principales actores de IA y los responsables políticos.
La situación destaca la vulnerabilidad de los pesos de los modelos una vez que se exponen a través de endpoints de API, incluso con las salvaguardas existentes en su lugar.
📖 Read the full source: r/ClaudeAI
👀 Ver también

El complemento de código Claude causa picos de CPU y drena la batería
Un usuario descubrió que el complemento de Telegram de Claude Code genera múltiples procesos bun.exe que se ejecutan al 100% de la CPU incluso con la tapa del portátil cerrada, causando un drenaje rápido de la batería. Los procesos sobreviven a los ciclos de suspensión/activación y requieren pasos de limpieza específicos para eliminarlos.

Usuario de Reddit reporta persistencia de VM OpenClaw y actividad sospechosa
Un usuario de Reddit informa que su máquina virtual OpenClaw se reinicia automáticamente después de cerrarse y muestra un comportamiento sospechoso, incluyendo la apertura de Microsoft Store y el intento de descargar archivos cuestionables.

Investigación: Los Caracteres Unicode Invisibles Pueden Secuestrar Agentes de LLM a través del Acceso a Herramientas
Un estudio evaluó si los modelos de lenguaje grandes (LLM) siguen instrucciones ocultas en caracteres Unicode invisibles incrustados en texto normal, utilizando dos esquemas de codificación en cinco modelos y 8,308 salidas calificadas. Hallazgo clave: el acceso a herramientas amplifica el cumplimiento de menos del 17% a 98-100%, con modelos escribiendo scripts en Python para decodificar los caracteres ocultos.

A2A Secure: Como los desarrolladores crearon comunicacion criptografica entre agentes OpenClaw
Un nuevo protocolo permite que los agentes OpenClaw se comuniquen de forma segura usando firmas Ed25519 sin claves API compartidas.