KI-Chatbots leaken Telefonnummern: Datenschutz-Problem

KI-Chatbots geben echte Telefonnummern von Menschen preis. Ein Reddit-Nutzer berichtete, dass er von Anrufen Fremder überflutet wurde, die einen Anwalt oder Schlüsseldienst suchten – fehlgeleitet von Googles Gemini. Im März wurde ein Softwareentwickler in Israel auf WhatsApp kontaktiert, nachdem Gemini seine private Nummer als PayBox-Kundenservice ausgegeben hatte. Im April brachte ein Doktorand Gemini dazu, die Handynummer eines Kollegen auszuspucken.

Wie es passiert

LLMs werden mit aus dem Web gescrapten Daten trainiert, die personenbezogene Informationen enthalten. Der Artikel stellt fest, dass der Open-Source-Datensatz DataComp CommonPool Lebensläufe, Führerscheine und Kreditkarten umfasst. Selbst eine einzige Instanz einer online geposteten Telefonnummer (z. B. auf einer Q&A-Website im Jahr 2015) kann Jahre später reproduziert werden.

Ausmaß des Problems

DeleteMe, das bei der Entfernung persönlicher Daten aus dem Internet hilft, meldet einen Anstieg von KI-bezogenen Datenschutzanfragen um 400% in den letzten sieben Monaten – auf bis zu ein paar Tausend. Aufschlüsselung: 55% betreffen ChatGPT, 20% Gemini, 15% Claude, 10% andere. Zwei häufige Szenarien: Ein Nutzer fragt nach sich selbst und erhält genaue Wohn-/Telefondaten, oder der Chatbot generiert plausible, aber falsche Kontaktdaten für jemand anderen.

Rob Shavell (Mitbegründer von DeleteMe) sagt, dass sich die Beschwerden typischerweise darauf beziehen, dass der Chatbot bei harmlosen Fragen über den Nutzer genaue Privatadressen, Telefonnummern, Familiennamen oder Arbeitgeberdetails zurückgibt.

Was man tun kann

Experten sagen, die Ursache liege in personenbezogenen Daten in den Trainingsdaten, der genaue Mechanismus sei jedoch unklar. Nutzer können wenig tun, um eine Preisgabe zu verhindern. Der Artikel deutet an, dass sich das Problem verschlimmern wird, da KI-Unternehmen nach neuen Datenquellen suchen.

📖 Read the full source: HN AI Agents

KI-Chatbots geben echte Telefonnummern preis: Das Problem der Offenlegung personenbezogener Daten

Wie es passiert

Ausmaß des Problems

Was man tun kann

👀 Siehe auch

Die menschliche Wurzel des Vertrauens: Verantwortung für autonome KI-Agenten etablieren.

Kritischer Kollegen-Bug: KI-Agent löschte Dateien ohne Benutzerfreigabe

Fake Claude Code-Seite verbreitete Trojaner — von Windows Defender als Trojan:Win32/Kepavll!rfn erkannt

Vitalik Buterins Ansatz für eine sichere lokale LLM-Einrichtung