Mercor Breach: 4TB de muestras de voz e identificaciones robadas – Qué pueden hacer ahora los atacantes

El 4 de abril de 2026, el grupo de extorsión Lapsus$ publicó a Mercor en su sitio de filtraciones. El volcado es de aproximadamente cuatro terabytes, que incluyen datos biométricos de voz junto con documentos de identidad emitidos por el gobierno de más de 40.000 contratistas que etiquetaron datos, grabaron lecturas de pasajes y realizaron llamadas de verificación para el entrenamiento de IA.
Por qué esta filtración es diferente
La mayoría de las filtraciones de voz se dividen en dos categorías: grabaciones de centros de llamadas sin un mapeo de identidad sencillo, o filtraciones de documentos de identidad sin audio. Mercor combinó ambas. El proceso de incorporación de contratistas solicitaba un escaneo del pasaporte o licencia de conducir, una selfie con la cámara web y luego una grabación de voz leyendo indicaciones guionizadas. Esa secuencia es exactamente lo que necesita un servicio de clonación de voz sintética como entrada. La clonación de voz de alta calidad ahora requiere aproximadamente 15 segundos de audio de referencia limpio: las grabaciones de Mercor tienen un promedio de 2 a 5 minutos de voz limpia como estudio por contratista, junto con una identidad verificada.
Qué pueden hacer los atacantes
Estos modelos de amenaza ya están documentados en el mundo real:
- Evasión de verificación bancaria: Varios bancos de EE. UU. y el Reino Unido utilizan la huella de voz como uno de dos factores. Un clon que lee una frase de desafío supera la puerta de audio, dejando solo una pregunta de conocimiento del mismo conjunto de datos filtrados.
- Vishing al empleador de la víctima: Llamar a recursos humanos o finanzas haciéndose pasar por el empleado para redirigir la nómina, solicitar una transferencia o desbloquear una estación de trabajo. Krebs on Security enumera más de dos docenas de casos confirmados desde 2023.
- Videollamadas deepfake (plantilla Arup): En 2024, un trabajador de finanzas en Arup transfirió ~25 millones de dólares después de una videollamada deepfake con múltiples personas construida a partir de material público; las filtraciones de Mercor proporcionan audio de estudio más una identidad verificada.
- Fraude de reclamaciones de seguros: Pindrop reportó un aumento interanual del 475% en ataques de voz sintética contra centros de llamadas de seguros durante 2025.
- Estafas románticas y de abuelos: El FBI IC3 registró pérdidas de 2.300 millones de dólares para víctimas mayores de 60 años en 2026; la categoría de más rápido crecimiento fueron las llamadas de suplantación de emergencia.
Cómo verificar si su voz está siendo mal utilizada
Si cargó una muestra de voz en Mercor o en cualquier intermediario de entrenamiento de IA durante 2025, trate su voz como una contraseña filtrada. No puede rotarla, pero puede cambiar lo que desbloquea:
- Audite su propia huella de audio pública: busque en YouTube, directorios de podcasts y grabaciones antiguas de Zoom muestras de su voz. Elimine lo que pueda.
📖 Lea la fuente completa: HN AI Agents
👀 Ver también

Talkie: Un LLM de 13B entrenado exclusivamente en textos anteriores a 1931, usando a Claude como juez en el entrenamiento RL
Investigadores publicaron Talkie, un LLM de 13B entrenado solo con texto publicado antes de 1931 (sin internet, sin datos de la Segunda Guerra Mundial). Claude Sonnet 4.6 se utilizó como juez en su pipeline de aprendizaje por refuerzo DPO en línea, y Claude Opus 4.4 generó conversaciones sintéticas de múltiples turnos para el ajuste fino. El modelo puede escribir código Python a partir de unos pocos ejemplos en contexto a pesar de no tener código moderno en el entrenamiento.

Las filtraciones del código fuente de Anthropic revelan funciones no anunciadas de Claude y el modelo interno.
Anthropic filtró accidentalmente 500,000 líneas de código fuente que contenían detalles sobre funciones no anunciadas de Claude, incluyendo la ejecución en segundo plano KAIROS, el modo sueño, el modo encubierto y un modelo interno llamado capibara. Esta es la segunda filtración de este tipo en 2025.

Títulos de Sistema de Claude Code Actualizados: Nuevo Recordatorio de Modificación de Archivos y Aclaraciones de REPL, Recordatorio de Análisis de Malware Eliminado
Las versiones 2.1.124 (+166 tokens) y 2.1.126 (-87 tokens) de Claude Code (CC) actualizan el prompt del sistema: añaden una advertencia de detección de modificación de archivos con presupuesto excedido, reemplazan la función de identidad principal por instrucciones explícitas del harness, aclaran el comportamiento de auto-await de thenables en REPL y eliminan el recordatorio de análisis de malware.

Release de GitHub Claude-Code v2.1.27: Actualizaciones y Correcciones Clave
Claude-Code v2.1.27 mejora el registro y corrige varios problemas, incluidos la gestión de contexto y la expiración del token OAuth en VSCode.