セキュリティ

Anthropicは、中国のAI研究所によるClaudeへの産業規模の蒸留攻撃を報告しています。

✍️ OpenClawRadar📅 公開日: February 24, 2026🔗 Source

Anthropicは、中国のAI研究所によるClaudeへの産業規模の蒸留攻撃を報告しています。

Ad

産業規模のモデル抽出作戦

Anthropicは、3つの中国AI研究所によるClaudeへの協調的な蒸留攻撃の詳細をまとめた調査結果を公開しました。この攻撃には、大規模なAPIインタラクションを通じてClaudeの推論能力を抽出するために、大規模な不正アカウントの作成が含まれていました。

Anthropicの報告書からの主な攻撃詳細

DeepSeek、Moonshot、MiniMaxが24,000以上の不正アカウントを作成
Claudeとの総やり取り回数は1,600万回を超える
MiniMaxだけで1,300万件のリクエストを実行
Anthropicが新モデルをリリースすると、MiniMaxは24時間以内にトラフィックのほぼ半分をリダイレクト
DeepSeekは特に思考連鎖と検閲安全な回答を標的にした
研究所が手法を適応させるにつれ、攻撃は時間とともに洗練度を増した

AI開発者へのセキュリティ的示唆

この事例は、数十億ドル規模の研究所が体系的に独自の能力を抽出しようとする際のAIモデルセキュリティの脆弱性を浮き彫りにしています。複数の組織にまたがり、新モデルリリースに適応するこれらの攻撃の規模と持続性は、これが孤立した事例ではなく、継続的な脅威ベクトルを表していることを示唆しています。

使用された手法（不正アカウント作成、特定能力のための標的クエリ、新モデルバージョンへの迅速な適応）は、他のAIシステムに対しても複製される可能性があり、開発者がワークフローに統合するサードパーティAIツールのセキュリティに疑問を投げかけています。

📖 完全なソースを読む: r/ClaudeAI

Ad

👀 See Also

AIエージェントのセキュリティ分析により、信頼モデルの破綻と高い脆弱性率が明らかに

AIエージェントのセキュリティ分析により、信頼モデルの破綻と高い脆弱性率が明らかに

AIエージェントのセキュリティ分析により、基本的な信頼モデルが破綻していることが示された。MCPパッケージの49%にセキュリティ上の問題があり、間接的インジェクション攻撃は最先端モデルに対して36〜98%の攻撃成功率を達成している。

Mar 23, 2026, 10:45 AM UTC

Google、犯罪ハッカーがAIを利用してゼロデイ脆弱性を発見したと発表

Google、犯罪ハッカーがAIを利用してゼロデイ脆弱性を発見したと発表

Googleは、攻撃者がAIエージェントを使い、これまで知られていなかったソフトウェアの脆弱性を発見・悪用したことを明らかにした。これは、実環境でAIが主導するゼロデイ発見が確認された初の事例となる。

May 11, 2026, 10:15 PM UTC

AIエージェントによるプロダクション削除インシデント：そのパターンと修正方法

AIエージェントによるプロダクション削除インシデント：そのパターンと修正方法

PocketOS、Replit、CursorにおけるAIエージェントによるプロダクション削除インシデントは、共通のアクセスパターンを持っています。対策：エージェントには本番環境の認証情報を与えず、すべての変更はポリシースコアリングゲートを通過したCI/CDを通じて行われます。

Apr 29, 2026, 12:16 AM UTC

MCPサンドボックス：信頼せずにMCPサーバーを隔離されたコンテナで実行

MCPサンドボックス：信頼せずにMCPサーバーを隔離されたコンテナで実行

開発者がMCP Sandboxを構築しました。これは、MCPサーバーを隔離されたgVisorコンテナで実行し、デフォルトでネットワークアクセスを拒否し、安全なシークレット注入を実現するほか、実行前のCVEスキャンとパターンチェックも行います。

Mar 30, 2026, 06:45 PM UTC