Anthropic berichtet über industrielle Maßstäbe erreichende Destillationsangriffe chinesischer KI-Labore auf Claude

✍️ OpenClawRadar📅 Veröffentlicht: 24. Februar 2026🔗 Source
Anthropic berichtet über industrielle Maßstäbe erreichende Destillationsangriffe chinesischer KI-Labore auf Claude
Ad

Industrieller Modellentzug im großen Stil

Anthropic hat Ergebnisse veröffentlicht, die koordinierte Destillationsangriffe auf Claude durch drei chinesische KI-Labore detailliert beschreiben. Die Angriffe umfassten die Erstellung betrügerischer Konten in großem Umfang, um Claudes Denkfähigkeiten durch massive API-Interaktionen zu extrahieren.

Wichtige Angriffsdetails aus Anthropics Bericht

  • DeepSeek, Moonshot und MiniMax erstellten über 24.000 betrügerische Konten
  • Die Gesamtzahl der Austausche mit Claude überstieg 16 Millionen
  • MiniMax allein feuerte 13 Millionen Anfragen ab
  • Als Anthropic ein neues Modell veröffentlichte, leitete MiniMax fast die Hälfte seines Datenverkehrs innerhalb von 24 Stunden um
  • DeepSeek zielte speziell auf Gedankenketten und zensursichere Antworten ab
  • Die Angriffe wurden im Laufe der Zeit ausgefeilter, als die Labore ihre Methoden anpassten
Ad

Sicherheitsimplikationen für KI-Entwickler

Dieser Vorfall verdeutlicht Schwachstellen in der KI-Modellsicherheit, wenn milliardenschwere Labore systematisch versuchen, proprietäre Fähigkeiten zu extrahieren. Das Ausmaß und die Beharrlichkeit dieser Angriffe – die mehrere Organisationen umfassen und sich an neue Modellveröffentlichungen anpassen – deuten darauf hin, dass dies eher eine anhaltende Bedrohung darstellt als isolierte Vorfälle.

Die verwendeten Methoden (Erstellung betrügerischer Konten, gezielte Abfragen nach bestimmten Fähigkeiten, schnelle Anpassung an neue Modellversionen) könnten potenziell gegen andere KI-Systeme repliziert werden, was Fragen zur Sicherheit von KI-Tools von Drittanbietern aufwirft, die Entwickler in ihre Arbeitsabläufe integrieren.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Open-Source-KI-Tools bergen Sicherheitsrisiken durch "trügerische Sicherheit durch Transparenz"
Sicherheit

Open-Source-KI-Tools bergen Sicherheitsrisiken durch "trügerische Sicherheit durch Transparenz"

Ein Reddit-Beitrag warnt vor Malware, die als Open-Source-KI-Agenten und -Tools getarnt ist, wobei bösartiger Code in großen Codebasen versteckt sein kann, die Nutzer für sicher halten, weil sie auf GitHub gehostet werden. Der Beitrag beschreibt, wie 'Vibe-Coding' und autonome KI-Agenten Nutzer dazu bringen, unbekannte Programme ohne Überprüfung auszuführen.

OpenClawRadar
Google TIG meldet ersten KI-generierten Zero-Day-Exploit im Live-Betrieb
Sicherheit

Google TIG meldet ersten KI-generierten Zero-Day-Exploit im Live-Betrieb

Die Google Threat Intelligence Group hat einen Bedrohungsakteur identifiziert, der einen Zero-Day-Exploit einsetzt, der vermutlich mit KI entwickelt wurde. Dies ist die erste beobachtete offensive Nutzung von KI zur Ausnutzung von Zero-Day-Sicherheitslücken.

OpenClawRadar
Sicherung der OpenClaw-Infrastruktur mit dem Pomerium Identitätsbewussten Proxy
Sicherheit

Sicherung der OpenClaw-Infrastruktur mit dem Pomerium Identitätsbewussten Proxy

Verwenden Sie Pomerium als identitätsbewussten Proxy für eine Zero-Trust-Authentifizierung, um den Zugang zum OpenClaw-Server abzusichern.

OpenClawRadar
Forschung: Unsichtbare Unicode-Zeichen können LLM-Agenten über Werkzeugzugriffe kapern
Sicherheit

Forschung: Unsichtbare Unicode-Zeichen können LLM-Agenten über Werkzeugzugriffe kapern

Eine Studie untersuchte, ob LLMs Anweisungen folgen, die in unsichtbaren Unicode-Zeichen versteckt sind, die in normalen Texten eingebettet sind. Dabei wurden zwei Kodierungsschemata über fünf Modelle und 8.308 bewertete Ausgaben getestet. Hauptergebnis: Der Zugang zu Werkzeugen steigert die Befolgung von unter 17 % auf 98–100 %, wobei Modelle Python-Skripte schreiben, um die versteckten Zeichen zu decodieren.

OpenClawRadar