Los componentes de la undécima aportación de datos del GP2

diciembre 1, 2025

Por Hampton Leonard, Mike A. Nalls, Dan Vitale, Mathew Koretsky, Kristin Levine, Mary B. Makarious, Lietsel Jones y Zih-Hua Fang

Resumen

En diciembre de 2025, el GP2 anunció su undécima publicación de datos en las plataformas Terra y Verily® Workbench en colaboración con AMP® PD. Esta edición incluye 20,842 participantes genotipados nuevos y 17,153 WGS de participantes nuevos, así como datos clínicos del exoma de 4,232 muestras nuevas. 

  • Los datos genotipados (NBA), que incluyen muestras localmente restringidas, corresponden ahora a un total de 103,786 participantes genotipados (46,327 con EP; 28,857 de control y 28,602 «otros» fenotipos).
  • Los datos de secuencias de genoma completo (WGS) corresponden ahora a un total de 38,226 participantes secuenciados (18,219 con EP, 9,172 de control y 10,835 «otros» fenotipos).
  • Los datos clínicos del exoma ascienden a 14,686 muestras con EP.
  • De las 122,317 muestras singulares con datos genéticos (NBA, WGS o datos clínicos del exoma), 32,897 participantes también cuentan con información clínica adicional.

¿Qué hay de nuevo en esta aportación de datos?

Ampliación de los datos genómicos Esta edición introduce una ampliación significativa del número de participantes con datos genéticos. Se agregaron:

  • 20,842 participantes nuevos con datos genotipados (NBA)
  • 17,153 participantes nuevos con datos de secuenciación del genoma completo (WGS)
  • 5915 participantes nuevos con datos clínicos adicionales
  • Un archivo hereditario (y el diccionario de datos correspondiente) con estimaciones de parentesco por pares entre familiares. Incluye tanto relaciones inferidas (con coeficientes de parentesco) como relaciones declaradas.

Los conjuntos de llamado de variantes conjuntas ahora incluyen las cohortes de AMP® PD

  • Los conjuntos de llamado de variantes conjuntas WGS ahora incluyen muestras de las siguientes siete cohortes de AMP® PD: BioFIND, HBS, PDBP, PPMI, LCC, STEADY-PD3 y SURE-PD3. 
    • Al procesar estas muestras junto con las del GP2 en lugar de hacerlo de forma independiente, se minimizan las omisiones y los artefactos, y se mejora la precisión del genotipo. 
  • Hemos agregado una columna a la clave maestra que indica qué muestras del GP2 también están presentes en el conjunto de datos AMP-PD.

Nuevos resúmenes estadísticos disponibles Hemos puesto a disposición de los usuarios de Nivel 1 varios resúmenes estadísticos de conjuntos de datos GWAS:

Datos clínicos Esta aportación contiene datos clínicos de un total de 122,317 participantes de quienes disponemos de datos genéticos y datos clínicos principales. De estos, disponemos de datos de fenotipado clínico profundo de 32,897 participantes. Esta información contiene los siguientes datos: 

  • Edad en el momento del diagnóstico y de la aparición de síntomas
  • Diagnóstico principal, actual y más reciente
  • Exámenes cognitivos, como el Miniexamen Cognoscitivo (MMSE) y la Evaluación Cognitiva de Montreal (MoCA)
  • Revisión patrocinada por la Movement Disorder Society de la Escala de Valoración Unificada de la Enfermedad de Parkinson (MDS-UPDRS)
  • «Otros» fenotipos detallados, como la demencia de cuerpos de Lewy (LBD)

Datos a nivel individual Ahora recopilamos datos de un total de 148 cohortes. Consulte el Panel de cohortes del GP2 para obtener más información sobre las cohortes compartidas.  La ascendencia determinada genéticamente de los participantes genotipados del GP2 se divide en once grupos de ascendencia. Las siguientes tablas presentan la ascendencia determinada genéticamente de los participantes genotipados de esta aportación de datos que pasaron el control de calidad de matrices de datos y de secuenciación del genoma completo. Estos números reflejan muestras de aportaciones anteriores, reagrupadas en el archivo clúster actualizado y sujetas a control de calidad. También incluyen las nuevas muestras genotipadas, que son exclusivas de la presente aportación de datos. La última tabla presenta información sobre la ascendencia genéticamente determinada de ciertos fenotipos sin EP clasificados como «otros». Tabla 1 Tabla 2 Tabla 3 Tabla 4

Acceso a los datos

Muestras localmente restringidas sujetas al RGPD, vía Verily Viewpoint Workbench Seguimos haciendo pruebas para brindar acceso a muestras localmente restringidas; es decir, muestras sujetas al Reglamento General de Protección de Datos (RGPD), gracias a nuestra colaboración con Verily Viewpoint Workbench. Para obtener acceso a la aportación completa en VWB, usted debe:

  1. Contar con acceso de nivel 2 autorizado por el GP2
  2. Llenar el formulario de solicitud para muestras sujetas al RGPD

En futuras aportaciones, seguiremos ampliando la diversidad de los participantes. Los invitamos a visitar este panel para conocer nuestro progreso. Los usuarios que ya tengan acceso de nivel 2 pueden explorar los datos en más profundidad en nuestro navegador de cohortes, que presentamos en un artículo de blog anterior Como siempre, ¡consulte el README que acompaña cada aportación de datos del GP2 para obtener más detalles sobre recomendaciones de control de calidad, pipelines, datos y análisis!

Conozca a los autores

Director de la Red de colaboración en la investigación

Hampton Leonard

National Institute on Aging/National Institutes of Health | USA

Consultor

Mike A. Nalls, PhD

National Institutes of Health | USA

Científico de datos

Dan Vitale

National Institutes of Health | USA

Ingeniero de datos y software

Mathew Koretsky, BSc

National Institutes of Health | WA

Científico de datos

Kristin Levine, MSc

Data Tecnica International | USA

Científica de datos biomédicos, contratista

Mary B. Makarious, PhD

National Institutes of Health | Washington D. C.

Analista de datos clínicos

Lietsel Jones, MSc

Data Tecnica International | Bethesda

Científica

Zih-Hua Fang, PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | USA