GitHub Copilot met à jour la politique d'utilisation des données pour l'entraînement des modèles

✍️ OpenClawRadar📅 Publié: March 26, 2026🔗 Source
GitHub Copilot met à jour la politique d'utilisation des données pour l'entraînement des modèles
Ad

Détails du changement de politique

GitHub a annoncé qu'à partir du 24 avril 2026, les données d'interaction des utilisateurs de Copilot Free, Pro et Pro+ seront utilisées pour entraîner et améliorer leurs modèles d'IA, sauf si les utilisateurs se désinscrivent. Les utilisateurs de Copilot Business et Copilot Enterprise ne sont pas concernés par cette mise à jour.

Si vous vous êtes précédemment désinscrit de la collecte de données pour les améliorations de produit, votre préférence a été conservée. Vous pouvez vous désinscrire dans les paramètres sous "Confidentialité".

Quelles données sont collectées

Les données d'interaction qui peuvent être collectées et exploitées incluent :

  • Les sorties acceptées ou modifiées par vous
  • Les entrées envoyées à GitHub Copilot, y compris les extraits de code présentés au modèle
  • Le contexte du code autour de la position de votre curseur
  • Les commentaires et la documentation que vous rédigez
  • Les noms de fichiers, la structure des dépôts et les modèles de navigation
  • Les interactions avec les fonctionnalités de Copilot (chat, suggestions en ligne, etc.)
  • Vos retours sur les suggestions (notations pouce vers le haut/vers le bas)
Ad

Quelles données ne sont PAS utilisées

Ce programme n'utilise pas :

  • Les données d'interaction de Copilot Business, Copilot Enterprise ou des dépôts appartenant à des entreprises
  • Les données d'interaction des utilisateurs qui se désinscrivent de l'entraînement des modèles dans leurs paramètres Copilot
  • Le contenu de vos problèmes, discussions ou dépôts privés au repos

GitHub note qu'ils utilisent délibérément l'expression "au repos" car Copilot traite effectivement le code des dépôts privés lorsque vous utilisez activement Copilot. Ces données d'interaction sont nécessaires au fonctionnement du service et pourraient être utilisées pour l'entraînement des modèles, sauf si vous vous désinscrivez.

Partage des données et contexte

Les données utilisées dans ce programme peuvent être partagées avec les filiales de GitHub, y compris Microsoft. Ces données ne seront pas partagées avec des fournisseurs de modèles d'IA tiers ou d'autres prestataires de services indépendants.

GitHub déclare qu'ils intègrent déjà des données d'interaction des employés de Microsoft et ont observé des améliorations significatives, notamment des taux d'acceptation accrus dans plusieurs langages. Ils commenceront également à utiliser les données d'interaction des employés de GitHub.

Les modèles initiaux de GitHub ont été construits en utilisant un mélange de données publiquement disponibles et d'échantillons de code élaborés manuellement.

📖 Read the full source: HN LLM Tools

Ad

👀 See Also

RTX 4090 vs H100 pour le Fine-Tuning de Llama-3-8B : Une Comparaison Coût-Performance
News

RTX 4090 vs H100 pour le Fine-Tuning de Llama-3-8B : Une Comparaison Coût-Performance

Un développeur a testé le fine-tuning de Llama-3-8B sur une RTX 4090 et sur des instances H100 louées. La configuration avec la 4090 a coûté 2 000 $ d'avance et a pris 24 heures, tandis que la location de H100 a coûté environ 80 $ et s'est terminée en 4 heures.

OpenClawRadar
Claude-Code v2.1.74 : Correction de fuites mémoire, optimisation du contexte et améliorations des plugins
News

Claude-Code v2.1.74 : Correction de fuites mémoire, optimisation du contexte et améliorations des plugins

Claude-Code v2.1.74 corrige une fuite de mémoire critique dans les réponses de l'API de streaming qui provoquait une croissance illimitée de la RSS sur les chemins de code Node.js/npm. La mise à jour ajoute des suggestions exploitables à la commande /context et introduit le paramètre autoMemoryDirectory pour un stockage personnalisé de la mémoire automatique.

OpenClawRadar
Porte d'Attention : Le Défi de l'Oubli Sélectif dans les Systèmes de Mémoire IA
News

Porte d'Attention : Le Défi de l'Oubli Sélectif dans les Systèmes de Mémoire IA

Un développeur construisant un système de mémoire à cinq couches pour un bot OpenClaw identifie une limitation clé : les approches actuelles se concentrent sur le rappel mais manquent de mécanismes pour supprimer les informations non pertinentes pendant les tâches ciblées, similaire au filtrage attentionnel humain.

OpenClawRadar
Les limites de la reconnaissance vocale de Claude et la solution de contournement des utilisateurs avec Spokenly et Parakeet TDT
News

Les limites de la reconnaissance vocale de Claude et la solution de contournement des utilisateurs avec Spokenly et Parakeet TDT

Un utilisateur signale que la transcription par microphone intégrée de Claude est inexacte comparée à celle de ChatGPT, créant plus de travail qu'elle n'en économise. Ils ont mis en œuvre une solution de contournement utilisant Spokenly sur Mac avec le modèle Parakeet TDT de NVIDIA pour améliorer les performances.

OpenClawRadar