Anthropic-Bericht beschreibt Massen-Distillation von Claude durch chinesische KI-Firmen

✍️ OpenClawRadar📅 Veröffentlicht: 24. Februar 2026🔗 Source
Anthropic-Bericht beschreibt Massen-Distillation von Claude durch chinesische KI-Firmen
Ad

Destillationsoperation in großem Maßstab

Der Bericht von Anthropic dokumentiert systematische Destillationsbemühungen von drei chinesischen KI-Unternehmen: DeepSeek, Moonshot AI und MiniMax. Die Operation umfasste die Erstellung von etwa 24.000 gefälschten Konten und die Durchführung von über 16 Millionen Austauschen mit Claude über Proxy-Netzwerke, die bis zu 20.000 Konten gleichzeitig betrieben.

Spezifische Destillationsmethoden

DeepSeek ließ Claude seine eigene Argumentation Schritt für Schritt erklären und nutzte diese Erklärungen dann als Trainingsdaten. Sie forderten Claude auch auf, politisch sensible Fragen zu chinesischen Dissidenten zu beantworten, um Daten zur Zensurumgehung aufzubauen. MiniMax führte mehr als 13 Millionen Austausche durch und wechselte innerhalb von 24 Stunden nach Veröffentlichung zu einem neuen Claude-Modell.

Ad

Sicherheitsauswirkungen für Nutzer

Der Bericht stellt direkt fest, dass destillierte Modelle wahrscheinlich nicht die ursprünglichen Sicherheitsmechanismen beibehalten. Während Routinefragen ähnliche Antworten zwischen Original- und kopierten Modellen liefern, zeigen Grenzfälle mit medizinischen, rechtlichen oder nuancierten Themen kritische Unterschiede. Die Kopiermodelle "rasen mit falschem Selbstvertrauen durch", weil das Training, das Vorsicht lehrte, während der Destillation verloren ging.

Anthropic vergleicht dies mit einem Arzt, der echte Ärzte ein Jahr lang nur durch ein Fenster beobachtet hat – Routinefälle könnten angemessen behandelt werden, aber komplizierte Fälle bieten keine Garantien, und Nutzer können erst zu spät zwischen Routine- und komplexen Fällen unterscheiden.

Auswirkungen auf die Modellbewertung

Der Bericht weist auf einen kontraintuitiven Effekt hin: Uneinigkeit zwischen Modellen wird nach der Destillation wertvoller. Wenn zwei Modelle, die möglicherweise destillierte Fähigkeiten teilen, immer noch unterschiedliche Antworten geben, hat mindestens eines eine unabhängige Argumentation durchgeführt. Übereinstimmung zwischen Modellen wird weniger bedeutsam, während Uneinigkeit auf echte unabhängige Verarbeitung hinweist.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

VS Code 1.117.0 fügt Copilot automatisch als Co-Autor bei Commits hinzu – Das löst es aus
Nachrichten

VS Code 1.117.0 fügt Copilot automatisch als Co-Autor bei Commits hinzu – Das löst es aus

VS Code 1.117.0 hängt bei Verwendung von Inline-Vorschlägen ‚Co-authored-by: Copilot <[email protected]>‘ an Commits an – sogar für ein einzelnes Komma. Die Funktion ist Opt-out und nicht klar kommuniziert.

OpenClawRadar
Cursor AI-Studie: Kurzfristige Geschwindigkeitsgewinne führen zu langfristiger Komplexität
Nachrichten

Cursor AI-Studie: Kurzfristige Geschwindigkeitsgewinne führen zu langfristiger Komplexität

Eine Studie mit einer Differenz-in-Differenzen-Analyse ergab, dass die Einführung von Cursor AI zu statistisch signifikanten, aber vorübergehenden Geschwindigkeitssteigerungen führt, zusammen mit erheblichen und anhaltenden Zunahmen von statischen Analysewarnungen und Codekomplexität, die langfristige Verlangsamungen verursachen.

OpenClawRadar
Snowflake entlässt Dokumentationsmitarbeiter nach Schulung einer KI als Ersatz
Nachrichten

Snowflake entlässt Dokumentationsmitarbeiter nach Schulung einer KI als Ersatz

Snowflake bestätigte 'gezielte Personalreduzierungen' in den Teams für technische Dokumentation und Dokumentation, wobei Quellen von etwa 400 betroffenen Personen berichten. Das Unternehmen hatte acht Monate lang Dokumentationssitzungen per Bildschirmaufnahme aufgezeichnet, um Trainingsdatensätze aus den Arbeitsabläufen erfahrener Autoren zu erstellen.

OpenClawRadar
Claude Code v2.1.162 bringt Sitzungswarteinformationen, MCP-Timeout-Behebung und Überarbeitung der Agentenansicht
Nachrichten

Claude Code v2.1.162 bringt Sitzungswarteinformationen, MCP-Timeout-Behebung und Überarbeitung der Agentenansicht

Claude Code v2.1.162 fügt `waitingFor` zur `--json`-Ausgabe hinzu, behebt einen MCP-Timeout-Fehler unter 1000 ms, verbessert die Terminaldarstellung der Agents-Ansicht und mehr. Details im Inneren.

OpenClawRadar