Anthropic informa sobre ataques de destilación a escala industrial por parte de laboratorios chinos de IA contra Claude.

✍️ OpenClawRadar📅 Publicado: 24 de febrero de 2026🔗 Source

Operación de extracción de modelos a escala industrial

Anthropic ha publicado hallazgos que detallan ataques de destilación coordinados contra Claude por parte de tres laboratorios chinos de IA. Los ataques involucraron la creación de cuentas fraudulentas a gran escala para extraer las capacidades de razonamiento de Claude a través de interacciones masivas con la API.

Detalles clave del ataque según el informe de Anthropic

DeepSeek, Moonshot y MiniMax crearon más de 24,000 cuentas fraudulentas
Los intercambios totales con Claude superaron los 16 millones
Solo MiniMax realizó 13 millones de solicitudes
Cuando Anthropic lanzó un nuevo modelo, MiniMax redirigió casi la mitad de su tráfico en 24 horas
DeepSeek se enfocó específicamente en cadenas de pensamiento y respuestas seguras para la censura
Los ataques aumentaron en sofisticación con el tiempo a medida que los laboratorios adaptaban sus métodos

Implicaciones de seguridad para desarrolladores de IA

Este incidente resalta vulnerabilidades en la seguridad de los modelos de IA cuando laboratorios multimillonarios intentan sistemáticamente extraer capacidades propietarias. La escala y persistencia de estos ataques—que abarcan múltiples organizaciones y se adaptan a nuevos lanzamientos de modelos—sugiere que esto representa un vector de amenaza continuo en lugar de incidentes aislados.

Los métodos utilizados (creación de cuentas fraudulentas, consultas dirigidas para capacidades específicas, rápida adaptación a nuevas versiones de modelos) podrían replicarse potencialmente contra otros sistemas de IA, planteando preguntas sobre la seguridad de las herramientas de IA de terceros que los desarrolladores integran en sus flujos de trabajo.

📖 Read the full source: r/ClaudeAI

👀 Ver también

Seguridad

Desarrollador Construye Sandbox de MicroVM Firecracker para OpenClaw Security

Un desarrollador preocupado por la seguridad de los LLM construyó un sandbox de hardware dedicado utilizando microVMs Firecracker para aislar scripts de OpenClaw, donde cada script se ejecuta en su propio kernel de Linux con un límite de 128 MB de RAM y sin red por defecto.

30 mar 2026, 09:45 UTC

OpenClawRadar

Seguridad

Análisis de Seguridad de la Extracción de Componentes de OpenClaw para Agentes de IA Personalizados

Un desarrollador analizó el código fuente de OpenClaw para determinar qué componentes pueden extraerse de manera segura para su uso en agentes de IA personalizados, evaluando cada uno mediante el marco Lethal Quartet. El análisis revela riesgos de seguridad significativos en componentes como Semantic Snapshots y BrowserClaw.

14 mar 2026, 20:45 UTC

OpenClawRadar

Seguridad

Claude Code Identifica Puerta Trasera de Malware en Repositorio de GitHub Durante Auditoría Técnica

Un desarrollador utilizó Claude Code para auditar un repositorio de GitHub antes de su ejecución y descubrió una puerta trasera de ejecución remota de código en src/server/routes/auth.js que habría comprometido su máquina. La solicitud pedía una auditoría de diligencia técnica verificando la integridad del proyecto, la capa de IA/ML, la base de datos, la autenticación, los servicios backend, el frontend, la calidad del código y una estimación del esfuerzo.

10 mar 2026, 15:45 UTC

OpenClawRadar

Seguridad

Preocupaciones de Seguridad en OpenClaw: Claves API y Datos de Conversación en Riesgo en la Autohospedaje por Defecto

Un informe de Cisco indica que la seguridad de OpenClaw es "opcional, no integrada", con configuraciones predeterminadas que almacenan claves API en archivos .env en instancias VPS, creando una posible exposición para usuarios no técnicos que ejecutan en droplets básicos.

21 abr 2026, 02:41 UTC

OpenClawRadar