GitHub désactive la capacité de Copilot à insérer des publicités dans les demandes de fusion après le tollé des développeurs.

GitHub a désactivé une fonctionnalité controversée qui permettait à GitHub Copilot d'insérer des messages promotionnels dans les demandes de fusion. Ce changement est intervenu après que les développeurs aient découvert que Copilot ajoutait ce qui semblait être des publicités pour des outils tiers comme Raycast dans les descriptions et commentaires des PR.
Ce qui s'est passé
Le développeur australien Zach Manson a signalé qu'après qu'un collègue ait demandé à Copilot de corriger une faute de frappe dans l'une de ses demandes de fusion, il a trouvé un message de Copilot incitant les lecteurs à adopter l'application de productivité Raycast. La note disait : "Lancez rapidement des agents de codage Copilot depuis n'importe où sur votre machine macOS ou Windows avec Raycast", accompagnée d'un emoji éclair et d'un lien d'installation.
Manson a d'abord pensé qu'il s'agissait peut-être d'un empoisonnement des données d'entraînement ou d'une nouvelle injection d'invite, mais l'enquête a révélé plus de 11 400 PR avec le même conseil, tous apparemment ajoutés par Copilot. La recherche dans le code des PR pour des blocs invoquant Copilot a révélé de nombreux exemples de différents conseils insérés.
La réponse de GitHub
Martin Woodward, vice-président des relations avec les développeurs chez GitHub, a expliqué que le fait que Copilot insère des conseils dans les PR qu'il crée n'était pas un comportement nouveau, mais lui permettre de toucher aux PR qu'il n'avait pas créées était un changement récent qui "est devenu gênant". Tim Rogers, directeur principal de produit pour Copilot chez GitHub, a déclaré sur Hacker News que cette fonctionnalité était destinée "à aider les développeurs à apprendre de nouvelles façons d'utiliser l'agent dans leur flux de travail", mais a reconnu que "laisser Copilot modifier les PR écrits par un humain à son insu était une erreur de jugement".
GitHub a maintenant désactivé ces conseils dans les demandes de fusion créées ou modifiées par Copilot. La décision a été prise rapidement après que le problème ait attiré l'attention lundi, GitHub ayant répondu dans l'après-midi du même jour.
La réaction des développeurs
Manson a exprimé sa surprise que l'intégration GitHub Copilot Review ait la capacité de modifier les descriptions et commentaires d'autres utilisateurs, déclarant : "Je ne vois pas de cas d'utilisation valable pour cette capacité." Il a noté que s'il n'était pas surpris de voir GitHub expérimenter avec des modèles d'IA, il a trouvé "assez offensant" de voir la publicité Raycast insérée par Copilot dans sa propre PR comme s'il l'avait écrite lui-même.
Cet incident met en lumière les tensions persistantes autour des outils d'IA modifiant le travail des développeurs sans mécanismes de consentement clairs, en particulier lorsque ces modifications incluent du contenu promotionnel.
📖 Read the full source: HN LLM Tools
👀 See Also

Claude Opus 4.7 sorti avec raisonnement hybride et fenêtre contextuelle de 1 million de tokens
Anthropic a lancé Claude Opus 4.7, un modèle de raisonnement hybride avec une fenêtre de contexte de 1 million de tokens qui offre des performances renforcées en codage, vision et tâches complexes multi-étapes. Le tarif commence à 5 $ par million de tokens en entrée et 25 $ par million de tokens en sortie.

Deux projets de recherche remettent en cause l'apprentissage par imitation pour les agents web
Deux projets de recherche démontrent les limites de l'entraînement par imitation seule pour les agents web : 'Browser in the Loop' utilise l'apprentissage par renforcement avec un modèle de 8 milliards de paramètres pour améliorer le succès de la soumission de formulaires, tandis que 'Concentrate or Collapse' montre que l'apprentissage par renforcement standard échoue avec les modèles de langage par diffusion, nécessitant une optimisation au niveau de la séquence.
Point de vue d’un designer UX : Claude ne peut pas remplacer les designers expérimentés
Un designer UX affirme que Claude Design est surestimé et n'est utile que pour les non-designers pour prototyper des idées, les jeunes startups et les travaux de portfolio de niveau débutant.

Qwen3.6-27B tient sur un seul GPU de 24 Go, surpassant l'ancien 397B MoE sur SWE-bench
Qwen3.6-27B (Apache 2.0, contexte de 262K) fonctionne en Q4_K_M dans ~16,8 Go, atteignant SWE-bench Verified 77,2 — surpassant Qwen3.5-397B-A17B MoE (76,2). Utilise l'attention linéaire Gated DeltaNet avec Thinking Preservation pour les workflows agentiques.