クロードのソースコード流出により、反蒸留機能、潜入モード、フラストレーション検知が明らかに

Anthropicは、CLIツールの完全な可読ソースコードを含む.mapファイルを、Claude Codeのnpmパッケージに誤って同梱して出荷しました。パッケージはその後撤回されましたが、コードはHacker Newsで広くミラーされ分析されました。これは、Anthropicのモデル仕様の別の最近の流出に続くものです。
蒸留防止:模倣者を汚染するための偽ツールの注入
claude.ts(301-313行)には、ANTI_DISTILLATION_CCというフラグがあります。有効にすると、Claude CodeはAPIリクエストでanti_distillation: ['fake_tools']を送信し、サーバーにシステムプロンプトに囮のツール定義を静かに注入するよう指示します。これは、競合モデルを訓練するためにAPIトラフィックを記録している誰かがいた場合、その訓練データを汚染するように設計されています。
有効化には4つの条件が必要です:ANTI_DISTILLATION_CCコンパイル時フラグ、CLIエントリーポイント、自社APIプロバイダー、およびtengu_anti_distill_fake_tool_injection GrowthBookフラグがtrueを返すこと。リクエストボディからanti_distillationフィールドを削除するMITMプロキシは、これを完全に回避します。CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS環境変数を真の値に設定すると、メカニズム全体が無効になります。
betas.ts(279-298行)の2番目の蒸留防止メカニズムは、サーバーサイドのコネクターテキスト要約を実装しています。有効にすると、APIはツール呼び出しの間のアシスタントのテキストをバッファリングし、要約し、暗号署名付きで要約を返します。これは、APIトラフィックの記録では完全な推論チェーンではなく、要約のみがキャプチャされることを意味します。
アンダーカバーモード:AIであることを隠すAI
ファイルundercover.tsは、Claude Codeが非内部リポジトリで使用される際に、Anthropic内部の痕跡をすべて除去するモードを実装しています。モデルに、「カピバラ」や「テング」などの内部コードネーム、内部Slackチャンネル、リポジトリ名、または「Claude Code」というフレーズ自体を決して言及しないよう指示します。15行目には「強制オフはありません。これはモデルコードネームの流出に対する防御です。」と記載されています。
CLAUDE_CODE_UNDERCOVER=1で強制的にオンにすることはできますが、強制的にオフにする方法はありません。外部ビルドでは、関数全体がデッドコード除去され、自明なreturn文になります。これは、オープンソースプロジェクトにおけるAnthropic従業員によるAI作成のコミットやPRには、AIが作成したことを示す表示がないことを意味します。
正規表現によるフラストレーション検出
userPromptKeywords.tsには、ユーザーのフラストレーションを検出する正規表現パターンが含まれています:/\b(wtf|wth|ffs|omfg|shit(ty|tiest)?|dumbass|horribl(ソースでは不完全)。これは、システムがキーワードマッチングを通じてフラストレーションを感じているユーザーを特定しようとしていることを示唆しています。
その他の発見
- JSランタイム以下のネイティブクライアント認証
- 1日あたり250,000回の無駄なAPI呼び出し
- KAIROS:未リリースの自律エージェントモード
この流出は、AnthropicがOpenCodeに法的脅迫を送り、Claude Codeの内部APIを使用してサブスクリプション料金でOpusにアクセスするサードパーティツールがあったため、組み込みのClaude認証を削除するよう強制してからわずか10日後に発生しました。
📖 全文を読む: HN AI Agents
👀 See Also

InclusionAI、Ring-2.6-1Tをリリース:エージェントワークフロー向けの1兆パラメータモデル
InclusionAIは、エージェント実行向けに最適化された1兆パラメータの推論モデルRing-2.6-1Tを発表しました。高/超高の2段階の推論努力レベルと、IcePopアルゴリズムによる非同期RLトレーニングを特徴としています。

Claudeは会話にインラインのインタラクティブなチャートや図表を追加します
Claudeは現在、チャット会話内で直接カスタムチャート、図表、視覚化を作成し、議論が進むにつれてユーザーが視覚化を調整・修正できるようになりました。この機能はすべてのプランタイプでベータ版として利用可能で、サイドパネルではなくインラインで表示されます。

アンソロピック、6月からOpenClaw経由でのClaudeサブスクリプション利用を許可
OpenClaw DevのTwitterアカウントが発表したところによると、Anthropicは6月からOpenClawを通じたClaudeのサブスクリプション利用を許可する予定です。

マイクロソフト、トレーニングの洞察を伴うPhi-4-reasoning-vision-15Bマルチモーダルモデルをリリース
マイクロソフトリサーチは、Microsoft Foundry、HuggingFace、GitHubを通じて利用可能な150億パラメータのオープンウェイトマルチモーダル推論モデル「Phi-4-reasoning-vision-15B」をリリースしました。このモデルは推論能力と効率性のバランスを取り、数学・科学推論やUI理解に優れています。