Anthropic enthüllt industrielle Claude-KI-Datenextraktion durch chinesische Labore

Anthropic hat Details über einen groß angelegten Datenextraktionsvorgang gegen Claude AI öffentlich bekannt gegeben. Laut einem Reddit-Beitrag, der die Situation analysiert, handelte es sich dabei nicht um isolierte Forschungsaktivitäten, sondern um einen industriellen Einsatz unter Beteiligung mehrerer chinesischer KI-Unternehmen.
Das Ausmaß des Vorfalls
Der Vorgang umfasste drei spezifische Akteure: DeepSeek, Moonshot AI und MiniMax. Diese Labore erstellten über 24.000 betrügerische Konten, um auf die API von Claude zuzugreifen. Über diese Konten griffen sie mehr als 16 Millionen Austausche von Claude ab, um ihre eigenen Modelle zu trainieren.
Unterschied zwischen legitimer und unrechtmäßiger Destillation
Das Quellenmaterial klärt den Unterschied zwischen Standardpraktiken der Branche und dem, was hier geschah:
- Standarddestillation: Verwendung eines großen Modells, um eine kleinere, effizientere Version für kommerzielle Kunden zu trainieren
- Unrechtmäßige Destillation: Beschrieben als "Fähigkeitswäsche" – das Abzweigen von Sicherheitsvorkehrungen und Logikstrukturen aus amerikanischen Modellen und deren direkte Einspeisung in ausländische militärische, nachrichtendienstliche und Überwachungssysteme
Weitreichende Implikationen
Anthropic warnt davor, dass diese Angriffe immer ausgefeilter und häufiger werden. Das "Ehrensystem" der API-Nutzung scheint unzureichend, um solche Vorgänge zu verhindern. Das Unternehmen fordert koordinierte Abwehrmaßnahmen zwischen den großen KI-Akteuren und politischen Entscheidungsträgern.
Die Situation verdeutlicht die Anfälligkeit von Modellgewichten, sobald sie über API-Endpunkte zugänglich sind, selbst bei bestehenden Sicherheitsvorkehrungen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Agent-Drift: Sicherheitsüberwachungstool für KI-Agenten

Fünf wesentliche Sicherheitsschritte für OpenClaw-Instanzen
Ein Reddit-Beitrag warnt davor, dass das Ausführen von OpenClaw mit Standardeinstellungen erhebliche Sicherheitsrisiken birgt, und nennt fünf sofortige Maßnahmen: Standardport ändern, Tailscale für privaten Zugriff nutzen, eine Firewall konfigurieren, separate Konten für den Agenten erstellen und Skills vor der Installation überprüfen.

Versteckte Audiosignale kapern Sprach-KI-Systeme mit 79-96% Erfolgsrate
Forschung zeigt, dass unhörbare Audio-Clips LALMs dazu zwingen können, unbefugte Befehle wie Websuchen, Dateidownloads und E-Mail-Exfiltration mit einer Erfolgsrate von 79-96 % bei 13 Modellen, darunter Mistral und Microsoft-Dienste, auszuführen.

KI-Agenten ermöglichen Solo-Hackern, Regierungen zu infiltrieren und Ransomware-Kampagnen durchzuführen
Ein Einzeloperateur, der Claude Code und ChatGPT einsetzte, hat 150 GB aus mexikanischen Regierungsbehörden entwendet, darunter 195 Millionen Steuerzahlerdaten. Ein weiterer Angreifer nutzte Claude Code, um eine vollständige Erpressungskampagne gegen 17 Gesundheits- und Notdiensteinrichtungen durchzuführen.