Anthropic berichtet über industrielle Maßstäbe erreichende Destillationsangriffe chinesischer KI-Labore auf Claude

✍️ OpenClawRadar📅 Veröffentlicht: 24. Februar 2026🔗 Source

Industrieller Modellentzug im großen Stil

Anthropic hat Ergebnisse veröffentlicht, die koordinierte Destillationsangriffe auf Claude durch drei chinesische KI-Labore detailliert beschreiben. Die Angriffe umfassten die Erstellung betrügerischer Konten in großem Umfang, um Claudes Denkfähigkeiten durch massive API-Interaktionen zu extrahieren.

Wichtige Angriffsdetails aus Anthropics Bericht

DeepSeek, Moonshot und MiniMax erstellten über 24.000 betrügerische Konten
Die Gesamtzahl der Austausche mit Claude überstieg 16 Millionen
MiniMax allein feuerte 13 Millionen Anfragen ab
Als Anthropic ein neues Modell veröffentlichte, leitete MiniMax fast die Hälfte seines Datenverkehrs innerhalb von 24 Stunden um
DeepSeek zielte speziell auf Gedankenketten und zensursichere Antworten ab
Die Angriffe wurden im Laufe der Zeit ausgefeilter, als die Labore ihre Methoden anpassten

Sicherheitsimplikationen für KI-Entwickler

Dieser Vorfall verdeutlicht Schwachstellen in der KI-Modellsicherheit, wenn milliardenschwere Labore systematisch versuchen, proprietäre Fähigkeiten zu extrahieren. Das Ausmaß und die Beharrlichkeit dieser Angriffe – die mehrere Organisationen umfassen und sich an neue Modellveröffentlichungen anpassen – deuten darauf hin, dass dies eher eine anhaltende Bedrohung darstellt als isolierte Vorfälle.

Die verwendeten Methoden (Erstellung betrügerischer Konten, gezielte Abfragen nach bestimmten Fähigkeiten, schnelle Anpassung an neue Modellversionen) könnten potenziell gegen andere KI-Systeme repliziert werden, was Fragen zur Sicherheit von KI-Tools von Drittanbietern aufwirft, die Entwickler in ihre Arbeitsabläufe integrieren.

📖 Read the full source: r/ClaudeAI

👀 Siehe auch

Sicherheit

MCP Sandbox: Führen Sie MCP-Server in isolierten Containern aus, ohne ihnen vertrauen zu müssen

Ein Entwickler hat MCP Sandbox erstellt, das MCP-Server in isolierten gVisor-Containern mit standardmäßig verweigerter Netzwerkzugriff und sicherer Geheimniseinschleusung ausführt, plus CVE-Scanning und Musterprüfung vor der Ausführung.

30. März 2026, 18:45 UTC

OpenClawRadar

Sicherheit

Bösartiges PyTorch Lightning-Paket stiehlt Anmeldedaten und infiziert npm-Pakete

Das PyPI-Paket 'lightning' in den Versionen 2.6.2 und 2.6.3 enthält Malware im Shai-Hulud-Stil, die Anmeldedaten, Token und Cloud-Geheimnisse stiehlt und über injizierte JavaScript-Payloads auf npm-Pakete übergreift.

30. Apr. 2026, 20:15 UTC

OpenClawRadar

Sicherheit

Live-Dashboard der exponierten OpenClaw-Tools

Dashboard, das exponierte Steuerpanelen von OpenClaw-Tools wie Moltbot und Clawdbot zeigt.

11. Feb. 2026, 17:45 UTC

OpenClawRadar

Sicherheit

Claude Code --dangerously-skip-permissions-Schwachstelle und Open-Source-Verteidigungstool

Lasso Security veröffentlichte eine Untersuchung, die indirekte Prompt-Injection-Schwachstellen in Claude Code bei Verwendung des Flags --dangerously-skip-permissions aufzeigt. Zu den Angriffsvektoren gehören manipulierte README-Dateien, bösartige Webinhalte und MCP-Server-Ausgaben. Sie veröffentlichten einen Open-Source-PostToolUse-Hook, der Werkzeugausgaben anhand von über 50 Erkennungsmustern überprüft.

24. März 2026, 23:45 UTC

OpenClawRadar