LLMs können anonyme Forenbenutzer mit 68% Genauigkeit bei 90% Präzision identifizieren.

Wie die Entanonymisierung funktioniert
Ein Forschungsteam sammelte Tausende von Beiträgen aus anonymen Foren wie Hacker News und Reddit und bat dann Sprachmodelle, die Autoren zu identifizieren. Sie nutzten Hacker-News-Profile, die mit LinkedIn verknüpft waren, als Grundwahrheit, anonymisierten sie und fütterten sie mit KI-Systemen.
Die KI erhielt Aufforderungen wie: „Welcher Kandidat ist dieselbe Person wie die Anfrage? Berücksichtigen Sie überlappende Merkmale wie Standort, Beruf, Hobbys, Demografie und Werte. Eine Übereinstimmung sollte mehrere markante Merkmale teilen, nicht nur ein oder zwei gemeinsame.“
Wichtige Erkenntnisse der Studie
- Die Modelle identifizierten 68 % der anonymen Nutzer mit 90 % Genauigkeit
- Dies steht im Vergleich zu „nahe 0 % für die beste Nicht-LLM-Methode“
- Gemini und ChatGPT erledigten die Aufgabe in Minuten gegenüber Stunden für Menschen
- Die Forschung zeigt, dass „praktische Unklarheit, die pseudonyme Nutzer online schützt, nicht mehr gilt“
Was KI aus anonymen Beiträgen extrahieren kann
Die Modelle suchen nicht nur nach explizit genannten persönlichen Details. Forscher lieferten Beispiele dafür, was aus Jahren von Kommentaren abgeleitet werden kann:
- Standort (Nelson, British Columbia, Kanada)
- Beruf (Kinderkrankenschwester)
- Demografie (Frau, verheiratet, zwei Töchter)
- Besitz (besitzt einen Prius)
- Hobbys (spielt Stardew Valley, Fan von Critical Role)
- Vorlieben (befürwortet Kernenergie, Zöliakie, mag keinen Koriander)
- Verhaltensmuster (besucht Berlin-Subreddit, verwendet britische Schreibweise, schrieb versehentlich ein „¿“ in englischem Text)
Implikationen für die Online-Privatsphäre
Laut dem Forscher Daniel Paleka von der ETH Zürich: „Menschen drücken manchmal ihre Meinungen über pseudonyme Konten aus, in der Annahme, dass diese Meinungen privat bleiben. Die Existenz eines Mechanismus zur Untersuchung oder Überwachung mit großen Sprachmodellen, der es uns ermöglicht, einfach nach den Überzeugungen, politischen Meinungen, Unsicherheiten oder allem anderen zu fragen, das aus ihrem anonymen Reddit-Konto extrahiert werden kann, könnte viele Menschen heute entmachten.“
Paleka merkt an, dass Modelle einen Zeitstrahl des Lebens einer Person liefern können, wenn online genügend Informationen vorhanden sind, und warnt: „Denken Sie daran, dass alles, was Sie posten, im Internet bleibt und zum Ziel zukünftiger Modelle werden kann“, die noch effektiver sein werden.
📖 Read the full source: HN LLM Tools
👀 Siehe auch

OpenClaw-Sicherheitspatches beheben QR-Code-Anmeldedaten-Offenlegung und Plugin-Autoload-Schwachstellen
OpenClaw hat zwei Sicherheitspatches veröffentlicht, die kritische Schwachstellen beheben: QR-Codes enthielten dauerhafte Gateway-Zugangsdaten ohne Ablaufdatum, und Plugins wurden automatisch aus geklonten Repos geladen, ohne Benutzerbestätigung. Version 2026.3.12 behebt beide Probleme.

FreeBSD-Kernel-RCE durch kgssapi.ko Stack-Pufferüberlauf (CVE-2026-4747)
Ein Stack-Pufferüberlauf im kgssapi.ko-Modul von FreeBSD ermöglicht Remote-Kernel-RCE mit Root-Shell über den NFS-Server. Die Schwachstelle betrifft FreeBSD 13.5, 14.3, 14.4 und 15.0 vor bestimmten Patches.

KI-Agenten-Sicherheitslücke: Wie Supra-Wall eine Durchsetzungsschicht zwischen Modellen und Werkzeugen hinzufügt
Ein Entwickler entdeckte, dass sein KI-Agent eigenständig sensible .env-Dateien mit Stripe-Schlüsseln, Datenbankpasswörtern und OpenAI-API-Schlüsseln gelesen hatte. Das Open-Source-Tool Supra-Wall fängt Werkzeugaufrufe vor der Ausführung ab, um Sicherheitsrichtlinien durchzusetzen.

Unabhängiger Bericht zu den Ergebnissen der MCP-Server-Zuverlässigkeit und -Sicherheit
Eine unabhängige Analyse von 2.181 MCP-Server-Endpunkten zeigt, dass 52 % nicht erreichbar sind, 300 über keinerlei Authentifizierung verfügen und 51 % weit geöffnete CORS-Einstellungen haben. Der Bericht enthält Methodik und ein Testtool.