アンソピック社の報告書が明らかにした、中国AI企業によるクロードの大量蒸留

✍️ OpenClawRadar📅 公開日: February 24, 2026🔗 Source
アンソピック社の報告書が明らかにした、中国AI企業によるクロードの大量蒸留
Ad

大規模な蒸留作戦

Anthropicの報告書は、3つの中国AI企業(DeepSeek、Moonshot AI、MiniMax)による組織的な蒸留活動を記録しています。この作戦では、約24,000の偽アカウントを作成し、最大20,000のアカウントを同時に実行するプロキシネットワークを通じてClaudeと1,600万回以上のやり取りを行いました。

具体的な蒸留手法

DeepSeekはClaudeに自身の推論を段階的に説明させ、その説明をトレーニングデータとして使用しました。また、中国の反体制派に関する政治的に敏感な質問にClaudeに回答させ、検閲回避データを構築しました。MiniMaxは1,300万回以上のやり取りを実行し、新しいClaudeモデルがリリースされてから24時間以内にそれに切り替えました。

ユーザーへの安全性への影響

報告書は、蒸留されたモデルが元の安全性メカニズムを保持する可能性は低いと直接述べています。日常的な質問では元のモデルと複製モデルの回答は似ていますが、医療、法律、微妙なトピックを含むエッジケースでは重大な違いが明らかになります。複製モデルは「誤った自信を持って突き進む」とされ、これは注意を教えるトレーニングが蒸留中に失われたためです。

Anthropicはこれを、1年間窓越しに本物の医師を見ていただけの医師に例えています。日常的な症例は適切に処理されるかもしれませんが、複雑な症例では保証がなく、ユーザーは手遅れになるまで日常的と複雑なケースを区別できません。

モデル評価への影響

報告書は、直感に反する効果を指摘しています。モデル間の不一致は、蒸留後により価値のあるものになります。蒸留された能力を共有している可能性のある2つのモデルが異なる回答を出す場合、少なくとも1つは独立した推論を行っています。モデル間の一致は意味が薄れ、不一致は真の独立した処理を示します。

📖 完全なソースを読む: r/ClaudeAI

Ad

👀 See Also

🦀
News

UXデザイナーの視点:Claudeデザインは経験豊富なデザイナーには代われない

UXデザイナーが、Claude Designは過大評価されており、デザイナー以外がアイデアをプロトタイプする場合、初期のスタートアップ、エントリーレベルのポートフォリオ制作にのみ有用だと論じています。

OpenClawRadar
Claude Proユーザー、出力なしの単一プロンプトで5時間の使用枠を消費したと報告
News

Claude Proユーザー、出力なしの単一プロンプトで5時間の使用枠を消費したと報告

Claude Proユーザーが、たった1つのプロンプトで5時間の使用枠をすべて消費し、計画テキストのみを返して成果物が得られなかったと報告。内部推論中のトークン消費と安全策の欠如に関する問題を浮き彫りにしている。

OpenClawRadar
北京でのOpenClawミートアップ、技術者層が熱狂的に参加
News

北京でのOpenClawミートアップ、技術者層が熱狂的に参加

北京で開催されたOpenClawミートアップは立ち見客が出るほどの盛況ぶりで、開発者たちはマルチエージェント・オーケストレーション、自律ループ、プライベートデプロイメントについて詳細な質問を投げかけました。聴衆は特に、Planner、Developer、Verifierの各エージェントが自律的に協力してワンマンカンパニーを支えるデモに強い関心を示しました。

OpenClawRadar
GitHub CopilotがPRの説明に自己宣伝を挿入しました
News

GitHub CopilotがPRの説明に自己宣伝を挿入しました

ある開発者が、GitHub Copilotがプルリクエストの説明文にプロモーションコンテンツを編集して追加した事例を報告しました。この出来事はHacker Newsで427ポイントと141コメントを集め、大きな議論を呼びました。

OpenClawRadar