クロードのソースコード流出により、反蒸留機能、潜入モード、フラストレーション検知が明らかに

✍️ OpenClawRadar📅 公開日: April 1, 2026🔗 Source
クロードのソースコード流出により、反蒸留機能、潜入モード、フラストレーション検知が明らかに
Ad

Anthropicは、CLIツールの完全な可読ソースコードを含む.mapファイルを、Claude Codeのnpmパッケージに誤って同梱して出荷しました。パッケージはその後撤回されましたが、コードはHacker Newsで広くミラーされ分析されました。これは、Anthropicのモデル仕様の別の最近の流出に続くものです。

蒸留防止:模倣者を汚染するための偽ツールの注入

claude.ts(301-313行)には、ANTI_DISTILLATION_CCというフラグがあります。有効にすると、Claude CodeはAPIリクエストでanti_distillation: ['fake_tools']を送信し、サーバーにシステムプロンプトに囮のツール定義を静かに注入するよう指示します。これは、競合モデルを訓練するためにAPIトラフィックを記録している誰かがいた場合、その訓練データを汚染するように設計されています。

有効化には4つの条件が必要です:ANTI_DISTILLATION_CCコンパイル時フラグ、CLIエントリーポイント、自社APIプロバイダー、およびtengu_anti_distill_fake_tool_injection GrowthBookフラグがtrueを返すこと。リクエストボディからanti_distillationフィールドを削除するMITMプロキシは、これを完全に回避します。CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS環境変数を真の値に設定すると、メカニズム全体が無効になります。

betas.ts(279-298行)の2番目の蒸留防止メカニズムは、サーバーサイドのコネクターテキスト要約を実装しています。有効にすると、APIはツール呼び出しの間のアシスタントのテキストをバッファリングし、要約し、暗号署名付きで要約を返します。これは、APIトラフィックの記録では完全な推論チェーンではなく、要約のみがキャプチャされることを意味します。

Ad

アンダーカバーモード:AIであることを隠すAI

ファイルundercover.tsは、Claude Codeが非内部リポジトリで使用される際に、Anthropic内部の痕跡をすべて除去するモードを実装しています。モデルに、「カピバラ」や「テング」などの内部コードネーム、内部Slackチャンネル、リポジトリ名、または「Claude Code」というフレーズ自体を決して言及しないよう指示します。15行目には「強制オフはありません。これはモデルコードネームの流出に対する防御です。」と記載されています。

CLAUDE_CODE_UNDERCOVER=1で強制的にオンにすることはできますが、強制的にオフにする方法はありません。外部ビルドでは、関数全体がデッドコード除去され、自明なreturn文になります。これは、オープンソースプロジェクトにおけるAnthropic従業員によるAI作成のコミットやPRには、AIが作成したことを示す表示がないことを意味します。

正規表現によるフラストレーション検出

userPromptKeywords.tsには、ユーザーのフラストレーションを検出する正規表現パターンが含まれています:/\b(wtf|wth|ffs|omfg|shit(ty|tiest)?|dumbass|horribl(ソースでは不完全)。これは、システムがキーワードマッチングを通じてフラストレーションを感じているユーザーを特定しようとしていることを示唆しています。

その他の発見

  • JSランタイム以下のネイティブクライアント認証
  • 1日あたり250,000回の無駄なAPI呼び出し
  • KAIROS:未リリースの自律エージェントモード

この流出は、AnthropicがOpenCodeに法的脅迫を送り、Claude Codeの内部APIを使用してサブスクリプション料金でOpusにアクセスするサードパーティツールがあったため、組み込みのClaude認証を削除するよう強制してからわずか10日後に発生しました。

📖 全文を読む: HN AI Agents

Ad

👀 See Also

InclusionAI、Ring-2.6-1Tをリリース:エージェントワークフロー向けの1兆パラメータモデル
News

InclusionAI、Ring-2.6-1Tをリリース:エージェントワークフロー向けの1兆パラメータモデル

InclusionAIは、エージェント実行向けに最適化された1兆パラメータの推論モデルRing-2.6-1Tを発表しました。高/超高の2段階の推論努力レベルと、IcePopアルゴリズムによる非同期RLトレーニングを特徴としています。

OpenClawRadar
Claudeは会話にインラインのインタラクティブなチャートや図表を追加します
News

Claudeは会話にインラインのインタラクティブなチャートや図表を追加します

Claudeは現在、チャット会話内で直接カスタムチャート、図表、視覚化を作成し、議論が進むにつれてユーザーが視覚化を調整・修正できるようになりました。この機能はすべてのプランタイプでベータ版として利用可能で、サイドパネルではなくインラインで表示されます。

OpenClawRadar
アンソロピック、6月からOpenClaw経由でのClaudeサブスクリプション利用を許可
News

アンソロピック、6月からOpenClaw経由でのClaudeサブスクリプション利用を許可

OpenClaw DevのTwitterアカウントが発表したところによると、Anthropicは6月からOpenClawを通じたClaudeのサブスクリプション利用を許可する予定です。

OpenClawRadar
マイクロソフト、トレーニングの洞察を伴うPhi-4-reasoning-vision-15Bマルチモーダルモデルをリリース
News

マイクロソフト、トレーニングの洞察を伴うPhi-4-reasoning-vision-15Bマルチモーダルモデルをリリース

マイクロソフトリサーチは、Microsoft Foundry、HuggingFace、GitHubを通じて利用可能な150億パラメータのオープンウェイトマルチモーダル推論モデル「Phi-4-reasoning-vision-15B」をリリースしました。このモデルは推論能力と効率性のバランスを取り、数学・科学推論やUI理解に優れています。

OpenClawRadar