Los LLM pueden identificar a usuarios anónimos de foros con un 68% de precisión y un 90% de exactitud.

✍️ OpenClawRadar📅 Publicado: 23 de marzo de 2026🔗 Source
Los LLM pueden identificar a usuarios anónimos de foros con un 68% de precisión y un 90% de exactitud.
Ad

Cómo funciona la desanonimización

Un equipo de investigación recopiló miles de publicaciones de foros anónimos como Hacker News y Reddit, y luego pidió a los modelos de lenguaje que identificaran a los autores. Utilizaron perfiles de Hacker News vinculados a LinkedIn como referencia, los anonimizaron y los introdujeron en sistemas de IA.

A la IA se le dieron instrucciones como: "¿Qué candidato es la misma persona que la consulta? Considera rasgos superpuestos como ubicación, profesión, pasatiempos, datos demográficos y valores. Una coincidencia debe compartir múltiples rasgos distintivos, no solo uno o dos comunes."

Hallazgos clave del estudio

  • Los modelos identificaron al 68% de los usuarios anónimos con un 90% de precisión
  • Esto se compara con "casi 0% para el mejor método no basado en LLM"
  • Gemini y ChatGPT completaron la tarea en minutos frente a horas para los humanos
  • La investigación muestra que "la oscuridad práctica que protege a los usuarios seudónimos en línea ya no se sostiene"

Lo que la IA puede extraer de publicaciones anónimas

Los modelos no solo buscan detalles personales explícitamente declarados. Los investigadores proporcionaron ejemplos de lo que se puede inferir de años de comentarios:

  • Ubicación (Nelson, Columbia Británica, Canadá)
  • Profesión (enfermera pediátrica)
  • Datos demográficos (mujer, casada, dos hijas)
  • Posesiones (posee un Prius)
  • Pasatiempos (juega Stardew Valley, fan de Critical Role)
  • Preferencias (apoya la energía nuclear, celíaca, no le gusta el cilantro)
  • Patrones de comportamiento (visita el subreddit de Berlín, usa ortografía británica, escribió accidentalmente un "¿" en texto en inglés)
Ad

Implicaciones para la privacidad en línea

Según el investigador Daniel Paleka de ETH Zurich: "Las personas a veces expresan sus opiniones a través de cuentas seudónimas, asumiendo que esas opiniones permanecerán privadas. La existencia de un mecanismo para investigar o monitorear con grandes modelos de lenguaje que nos permite simplemente preguntar sobre las creencias, opiniones políticas, inseguridades o cualquier otra cosa que se pueda extraer de su cuenta anónima de Reddit, por ejemplo, podría desempoderar a muchas personas hoy en día."

Paleka señala que los modelos pueden proporcionar una línea de tiempo de la vida de una persona si hay suficiente información en línea, y advierte: "Ten en cuenta que todo lo que publicas permanece en internet y puede convertirse en el objetivo de futuros modelos" que serán aún más efectivos.

📖 Read the full source: HN LLM Tools

Ad

👀 Ver también

Claude Code Encuentra una Vulnerabilidad de 23 Años en el Kernel de Linux
Seguridad

Claude Code Encuentra una Vulnerabilidad de 23 Años en el Kernel de Linux

El investigador de Anthropic, Nicholas Carlini, utilizó Claude Code para descubrir múltiples desbordamientos de búfer de montón explotables de forma remota en el kernel de Linux, incluido uno que había estado oculto durante 23 años. La IA encontró los errores con una supervisión mínima al escanear todo el árbol de código fuente del kernel.

OpenClawRadar
Laboratorio de ataque y defensa RAG de código abierto para pilas locales de ChromaDB + LM Studio
Seguridad

Laboratorio de ataque y defensa RAG de código abierto para pilas locales de ChromaDB + LM Studio

Un laboratorio de código abierto mide la efectividad del envenenamiento de bases de conocimiento RAG en configuraciones locales predeterminadas con ChromaDB y LM Studio, mostrando una tasa de éxito del 95% en sistemas sin defensas y evaluando defensas prácticas.

OpenClawRadar
Linux Kernel Propone Sistema de Identidad Descentralizado para Reemplazar la Red de Confianza de PGP
Seguridad

Linux Kernel Propone Sistema de Identidad Descentralizado para Reemplazar la Red de Confianza de PGP

Los mantenedores del kernel de Linux están trabajando en una capa de identidad descentralizada llamada Linux ID para reemplazar la actual red de confianza PGP. El sistema utiliza identificadores descentralizados (DID) al estilo W3C y credenciales verificables para autenticar a los desarrolladores sin requerir sesiones presenciales de firma de claves.

OpenClawRadar
820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw
Seguridad

820 Habilidades Maliciosas Encontradas en el Mercado ClawHub de OpenClaw

Investigadores de seguridad identificaron 820 habilidades en el mercado ClawHub de OpenClaw que contienen malware confirmado, incluyendo keyloggers, scripts de exfiltración de datos y comandos de shell ocultos. Estas habilidades pueden ejecutar código e interactuar con el entorno local, creando riesgos de seguridad en la cadena de suministro.

OpenClawRadar