GitHub Copilot actualiza la política de uso de datos para el entrenamiento de modelos

Detalles del cambio de política
GitHub anunció que, a partir del 24 de abril de 2026, los datos de interacción de los usuarios de Copilot Free, Pro y Pro+ se utilizarán para entrenar y mejorar sus modelos de IA, a menos que los usuarios opten por no participar. Los usuarios de Copilot Business y Copilot Enterprise no se ven afectados por esta actualización.
Si anteriormente optaste por no participar en la recopilación de datos para mejoras del producto, tu preferencia se ha conservado. Puedes optar por no participar en la configuración, en la sección "Privacidad".
Qué datos se recopilan
Los datos de interacción que pueden recopilarse y aprovecharse incluyen:
- Resultados aceptados o modificados por ti
- Entradas enviadas a GitHub Copilot, incluidos fragmentos de código mostrados al modelo
- Contexto del código alrededor de la posición de tu cursor
- Comentarios y documentación que escribas
- Nombres de archivos, estructura de repositorios y patrones de navegación
- Interacciones con las funciones de Copilot (chat, sugerencias en línea, etc.)
- Tu retroalimentación sobre sugerencias (calificaciones de pulgar arriba/abajo)
Qué datos NO se utilizan
Este programa no utiliza:
- Datos de interacción de Copilot Business, Copilot Enterprise o repositorios propiedad de empresas
- Datos de interacción de usuarios que optan por no participar en el entrenamiento del modelo en su configuración de Copilot
- Contenido de tus problemas, discusiones o repositorios privados en reposo
GitHub señala que utilizan la frase "en reposo" deliberadamente porque Copilot sí procesa código de repositorios privados cuando estás usando activamente Copilot. Estos datos de interacción son necesarios para ejecutar el servicio y podrían usarse para entrenar el modelo, a menos que optes por no participar.
Compartición de datos y antecedentes
Los datos utilizados en este programa pueden compartirse con afiliados de GitHub, incluido Microsoft. Estos datos no se compartirán con proveedores externos de modelos de IA u otros proveedores de servicios independientes.
GitHub afirma que ya han estado incorporando datos de interacción de empleados de Microsoft y han visto mejoras significativas, incluido un aumento en las tasas de aceptación en múltiples idiomas. También comenzarán a utilizar datos de interacción de empleados de GitHub.
Los modelos iniciales de GitHub se construyeron utilizando una combinación de datos disponibles públicamente y muestras de código elaboradas manualmente.
📖 Read the full source: HN LLM Tools
👀 Ver también

Nota de versión de la actualización macOS Tahoe 26.5 acredita a Claude AI
Las notas de la versión macOS Tahoe 26.5 de Apple atribuyen crédito a Claude AI junto a los equipos de ingeniería, marcando el primer caso conocido en que se reconoce formalmente a una IA en el registro de cambios de Apple.

El Claude de Anthropic Realiza 80,000 Entrevistas Estructuradas como Alternativa a las Encuestas
Anthropic utilizó a Claude para realizar entrevistas estructuradas con aproximadamente 80,000 usuarios en más de 150 países y 70+ idiomas, con el LLM sirviendo tanto como entrevistador como analista para recopilar información conversacional.

Usuarios de Docker de OpenClaw: actualización 2026.3.13 sin etiquetas de Docker
Se ha lanzado la versión 2026.3.13 de OpenClaw, pero los usuarios de Docker deben evitar actualizar, ya que la imagen de Docker carece de las etiquetas 'latest' y '2026.3.13'. Los usuarios que ejecutan desde npm o git no se ven afectados.

Evolución de la Arquitectura de Caché KV: Desde GPT-2 hasta Mamba
El análisis de los costos de memoria de la caché KV muestra que GPT-2 utilizaba 300 KiB/token, Llama 3 lo redujo a 128 KiB/token con atención de consultas agrupadas, y DeepSeek V3 logró 68.6 KiB/token con atención latente multi-cabezal. Mamba/SSMs eliminan por completo la caché KV mediante estados ocultos de tamaño fijo.