GitHub Copilot、モデルトレーニングのためのデータ利用ポリシーを更新

ポリシー変更の詳細
GitHubは、2026年4月24日以降、ユーザーがオプトアウトしない限り、Copilot Free、Pro、Pro+ユーザーのインタラクションデータをAIモデルのトレーニングおよび改善に使用すると発表しました。Copilot BusinessおよびCopilot Enterpriseユーザーはこのアップデートの影響を受けません。
以前に製品改善のためのデータ収集をオプトアウトした場合、その設定は保持されています。「プライバシー」設定からオプトアウトできます。
収集されるデータ
収集および活用される可能性のあるインタラクションデータには以下が含まれます:
- ユーザーが承認または修正した出力
- GitHub Copilotに送信された入力(モデルに表示されたコードスニペットを含む)
- カーソル位置周辺のコードコンテキスト
- ユーザーが記述したコメントおよびドキュメント
- ファイル名、リポジトリ構造、ナビゲーションパターン
- Copilot機能とのインタラクション(チャット、インライン提案など)
- 提案に対するフィードバック(高評価/低評価)
使用されないデータ
このプログラムでは以下は使用されません:
- Copilot Business、Copilot Enterprise、または企業所有リポジトリからのインタラクションデータ
- Copilot設定でモデルトレーニングをオプトアウトしたユーザーのインタラクションデータ
- 保存状態のイシュー、ディスカッション、またはプライベートリポジトリのコンテンツ
GitHubは「保存状態」という表現を意図的に使用していると注記しています。Copilotは、ユーザーがCopilotをアクティブに使用している際にプライベートリポジトリのコードを処理するためです。このインタラクションデータはサービスを実行するために必要であり、オプトアウトしない限りモデルトレーニングに使用される可能性があります。
データ共有と背景
このプログラムで使用されるデータは、Microsoftを含むGitHubの関連会社と共有される可能性があります。このデータは、サードパーティのAIモデルプロバイダーや他の独立したサービスプロバイダーとは共有されません。
GitHubは、すでにMicrosoft従業員のインタラクションデータを組み込んでおり、複数言語での採用率向上など有意義な改善が見られたと述べています。また、GitHub従業員のインタラクションデータの使用も開始します。
GitHubの初期モデルは、公開データと手作業で作成されたコードサンプルの組み合わせを使用して構築されました。
📖 Read the full source: HN LLM Tools
👀 See Also

Qwen 3.6-35B-A3B KVキャッシュベンチ:M5 Max上のf16対q8_0対Turbo3対Turbo4、最大1Mコンテキスト
M5 MaxでのTheTomのTurboQuant Metalフォークのベンチマークでは、f16とq8_0は256Kを超えるとOOMになる一方、turbo3は1Mで6.5 tok/sのデコードを達成。コンテキストが長い場合、プリフィルはturbo3、デコードはturbo4が優位。

クロード・オーパス 4.7 分析:最高の知性を備えるが、コスト高で冗長
Claude Opus 4.7(適応推論、最大努力)は、Artificial Analysis知能指数で133モデル中1位を獲得し、スコア57を記録しましたが、入力100万トークンあたり5ドル、出力100万トークンあたり25ドルのコストがかかり、平均よりも大幅に高価です。

Claude、政府との対立の中でApp Storeチャートをトップに
AnthropicのClaudeアプリが、米国App Storeのトップダウンロードチャートで42位から1位に急上昇し、ChatGPTとGeminiが2位と3位を占めています。この急増は、AI技術の軍事および監視利用をめぐるAnthropicと米国政府の間の公的な意見の相違に続くものです。

クロードコードのソースコードが流出したと報じられ、エージェントのアーキテクチャ詳細が明らかになったとのことです。
AnthropicのAIコーディングエージェント「Claude Code」のソースコードが流出した模様で、システムプロンプト、エージェントループの実装、ツール呼び出しインフラを含む完全なリポジトリが含まれているとのことです。