Aperçu général
En juillet 2025, le GP2 a annoncé la dixième édition des données sur les plateformes Terra et Verily®Workbench, en collaboration avec l’AMP® PD. Cette édition comprend 11 109 participants au génotype répertorié supplémentaires et 13 339 participants au séquençage de génome entier (SGE) supplémentaires.
- Le réseau de données de génotypage répertoriées (outil NeuroBooster), y compris les échantillons strictement locaux, atteint désormais un total de 82 944 participants à génotype répertorié (dont 36 939 atteints de Parkinson, 19 821 cas-témoins et 26 184 « autres » phénotypes).
- Si l’on soustrait les échantillons strictement locaux, le nombre total s’élève à 65 303 cas (soit 28 586 atteints de Parkinson, 15 258 cas-témoins et 21 459 « autres » phénotypes).
- Les données du séquençage du génome entier (SGE) comprennent désormais un total de 21 073 participants séquencés (8 134 atteints de Parkinson, 3 531 cas-témoins et 9 408 « autres » phénotypes).
- Si l’on soustrait les échantillons strictement locaux, le nombre total atteint 16 608 participants (soit 6 801 atteints de Parkinson, 3 244 cas-témoins et 6 563 « autres » phénotypes).
- Il convient de noter que les cas recrutés par l’intermédiaire du réseau monogénique sont classés dans la catégorie « Autres ».
- Les données sur l’exome clinique comprennent désormais 10 454 échantillons avec la maladie de Parkinson (édition 8).
- Sur les 92 021 échantillons uniques dotés de données génétiques (NeuroBooster, SGE ou exome clinique), 26 982 personnes ont également fait l’objet d’une information clinique élargie.
Quoi de neuf dans cette édition ?
Expansion du code génétique Cette édition se caractérise par une une expansion sensible du nombre de participants dont les données géniques sont disponibles. Nous avons ajouté :
- 11 109 nouveaux participants aux données traitées par l’outil NeuroBooster
- 13 339 nouveaux participants aux données de séquençage de génome entier (SGE)
- 12 311 nouveaux participants avec accès élargi aux données cliniques
- Un fichier familial (et le dictionnaire de données correspondant) qui rapporte les estimations de parenté par paires entre les individus au sein des familles. Il comprend à la fois les relations déduites (avec coefficients de parenté) et les relations déclarées.
Inclusion de la région PAR dans l’imputation Nous avons réintroduit la région pseudo-autosomique (PAR) dans l’imputation des données de génotypage, améliorant ainsi la couverture et l’interprétation des variations des chromosomes sexuels. Cette amélioration s’inscrit dans le cadre des efforts continus visant à améliorer la couverture génomique et la précision analytique. Regroupement avec les cohortes AMP® PD
- Les échantillons provenant des cinq cohortes suivantes de l’AMP® PD sont regroupés avec les ensembles de variants SGE identifiés en cohortes : BioFind, PPMI, LCC, STEADY-PD3 et SURE-PD3.
- En traitant ces échantillons avec ceux du GP2 plutôt que séparément, il est possible de minimiser les données manquantes et les artefacts, et d’améliorer la précision du génotype.
- Nous avons ajouté une colonne à la clé maître pour indiquer les échantillons du GP2 également présents dans le jeu de données de l’AMP-PD.
Imputation ciblée du rs3115534 de certaines ascendances sélectionnées Pour répondre à l’intérêt marqué de la communauté pour le variant intronique rs3115534, étant donné qu’il est associé à un risque accru de Parkinson et du trouble du comportement en sommeil paradoxal, et qu’il a été validé d’un point de vue fonctionnel, nous avons mis en place une stratégie d’imputation ciblée afin de garantir son inclusion dans les jeux de données publiés.
- Plus précisément, le chromosome 1 a été imputé pour cinq ascendances (AFR, AAC, AMR, MDE et CAH) au moyen du panel de référence à couverture élevée (30 x) du projet « 1 000 génomes » (Phase 3).
- Après l’imputation, les données relatives au rs3115534 ont été fusionnées dans les fichiers imputés basés sur TOPMed, fournis avec les versions du GP2. Veuillez noter que les mesures d’imputation pour ce variant n’ont pas atteint le niveau de qualité minimum (R² < 0,3) dans d'autres groupes d'ascendance.
rs3115534 – Mesures d’imputation de la 10e édition utilisant le panel à couverture élevée (30 x) du projet « 1 000 génomes » (Phase 3). | |||||
Population | Statut | AF | MAF | AVG_CS | R2 |
AFR | IMPUTÉ | 0,761049 | 0,238951 | 0,992879 | 0,968831 |
AAC | IMPUTÉ | 0,855586 | 0,144414 | 0,993458 | 0,959606 |
AMR | IMPUTÉ | 0,983414 | 0,0165855 | 0,991453 | 0,507857 |
MDE | IMPUTÉ | 0,980407 | 0,0195926 | 0,990912 | 0,584081 |
CAH | IMPUTÉ | 0,93793 | 0,0620703 | 0,993982 | 0,909959 |
Nouvelles statistiques récapitulatives désormais disponibles Nous avons ouvert l’accès à plusieurs nouveaux jeux de données statistiques récapitulatives des études d’association pangénomiques afin d’élargir la représentativité mondiale :
- Meta-étude d’association pangénomique européenne du GP2 (EUR) (pré-publication; GitHub)
- Etude d’association pangénomique sud-africaine (pré-publication en attente; GitHub)
- Etude d’association pangénomique indienne (pré-publication; GitHub)
- Etude d’association pangénomique du TCSP (trouble du comportement pendant le sommeil paradoxal) (pré-publication en attente ; GitHub en attente)
- Etude d’association pangénomique-MP à grande échelle comprenant les participants d’Amérique latine (pré-publication en attente ; GitHub en attente)
Données cliniques Cette édition contient les données cliniques de 92 021 personnes dont les données génétiques et les données cliniques de base sont accessibles, parmi lesquelles 26 982 disposent de données de phénotypage clinique disponibles. Ces données incluent :
- Âge au moment du diagnostique et des premiers signes
- Diagnostics principaux, actuels et les plus récents
- Examens cognitifs tels que le Mini-Mental State Examination (MMSE) et le Montreal Cognitive Assessment (MoCA)
- Révision de l’échelle UPDRS parrainée par la Movement Disorder Society
- Détail des « autres » phénotypes, tels que la démence à corps de Lewy
Données à l’échelon individuel Nous extrayons désormais les données à partir d’un total de 124 cohortes. Veuillez consulter le tableau de bord des cohortes du GP2 pour obtenir des informations complémentaires au sujet des cohortes qui ont été partagées. Les participants au GP2 à l’ascendance génétiquement déterminée sont regroupés en onze groupes ; le tableau ci-dessous détaille l’ascendance des participants à génotype répertorié dans cette édition, dont l’éventail de données ainsi que les données relatives au séquençage du génome entier ont passé le contrôle de qualité. Ces chiffres correspondent aux échantillons des éditions précédentes, réorganisés selon la mise à jour du dossier du regroupement et ont fait l’objet d’un contrôle de qualité, tout comme les nouveaux échantillons de génotype, propres à cette édition. Le tableau final fournit des informations sur l’ascendance génétiquement déterminée d’autres phénotypes sélectionnés, non liés à la maladie de Parkinson.
Données de génotypage en réseau – 10e édition du GP2 | ||||
Ascendance | Total (+VWB) | MP (+VWB) | Cas-témoin (+VWB) | Autres (+VWB) |
Africaine | 3 754 (3 780) | 1 181 (1 191) | 2 305 (2 307) | 268 (282) |
Métissage africain | 1 192 (1 215) | 361 (370) | 760 (763) | 71 (82) |
Juive ashkenaze | 3 265 (3 472) | 1 482 (1 531) | 408 (435) | 1 375 (1 506) |
Latino-américaine et peuples autochtones des Amériques | 3 564 (3 608) | 1 974 (1 995) | 1 433 (1 439) | 157 (174) |
Est-asiatique | 6 619 (6 662) | 2 393 (2 411) | 2 697 (2 705) | 1 529 (1 546) |
Européenne | 41 901 (58 823) | 18 703 (26 778) | 5 899 (10 372) | 17 299 (21 673) |
Sud-asiatique | 801 (945) | 270 (317) | 260 (269) | 271 (359) |
Centre-asiatique | 1 670 (1 691) | 776 (782) | 624 (626) | 270 (283) |
Moyen-orientale | 1 349 (1 493) | 675 (752) | 535 (559) | 139 (182) |
Finlandaise | 116 (144) | 87 (106) | 8 (12) | 21 (26) |
Métissage complexe | 1 072 (1 111) | 684 (706) | 329 (334) | 59 (71) |
Total | 65 303 (82 944) | 28 586 (36 939) | 15 258 (19 821) | 21 459 (26 184) |
Données du séquençage du génome entier – 10e édition du GP2 | ||||
Ascendance | Total (+VWB) | MP (+VWB) | Cas-témoin (+VWB) | Autres (+VWB) |
Africaine | 1 671 (1 696) | 646 (656) | 848 (853) | 177 (187) |
Métissage africain | 254 (267) | 126 (130) | 113 (114) | 15 (23) |
Juive ashkenaze | 1 389 (1 485) | 337 (355) | 100 (106) | 952 (1 024) |
Latino-américaine et peuples autochtones des Amériques | 301 (333) | 154 (171) | 24 (24) | 123 (138) |
Est-asiatique | 2 525 (2 542) | 576 (582) | 343 (343) | 1 606 (1 617) |
Européenne | 8 354 (12 461) | 4 155 (5 389) | 1 131 (1 397) | 3 068 (5 675) |
Sud-asiatique | 309 (417) | 47 (73) | 10 (16) | 252 (328) |
Centre-asiatique | 833 (840) | 259 (261) | 329 (330) | 245 (249) |
Moyen-orientale | 788 (824) | 386 (394) | 308 (309) | 94 (121) |
Finlandaise | 22 (30) | 17 (20) | 4 (4) | 1 (6) |
Métissage complexe | 162 (178) | 98 (103) | 34 (35) | 30 (40) |
Total | 16 608 (21 073) | 6 801 (8 134) | 3 244 (3 531) | 6 563 (9 408) |
« Autres » phénotype – 10e édition du GP2 (sur VWB) | |||||||
Ascendance | Prodromique NeuroBooster/SGE | PSP NeuroBooster/ SGE | AD NeuroBooster/SGE | DLB NeuroBooster/ SGE | MSA NeuroBooster/ SGE | CBD/CBS NeuroBooster/SGE | FTD NeuroBooster/SGE |
Africaine | 16/7 | 6/4 | 0/0 | 2/0 | 7/4 | 1/0 | 0/0 |
Métissage africain | 23/7 | 4/2 | 1/0 | 0/0 | 2/0 | 1/0 | 0/0 |
Juive ashkenaze | 308/71 | 23/12 | 9/0 | 14/6 | 8/3 | 4/3 | 2/1 |
Latino-américaine et peuples autochtones des Amériques | 30/11 | 5/0 | 5/0 | 2/0 | 2/0 | 1/0 | 0/0 |
Est-asiatique | 27/4 | 14/63 | 4/4 | 18/0 | 6/178 | 2/32 | 0/0 |
Européenne | 4 206/848 | 1 307/ 920 | 484/136 | 442/340 | 421/ 334 | 166/159 | 65/63 |
Sud-asiatique | 3/2 | 34/32 | 1/0 | 5/1 | 5/8 | 9/9 | 2/2 |
Centre-asiatique | 4/4 | 4/1 | 70/72 | 4/1 | 1/0 | 4/1 | 0/0 |
Moyen-orientale | 14/1 | 9/4 | 2/2 | 1/0 | 0/0 | 1/1 | 1/1 |
Finlandaise | 9/0 | 2/1 | 2/0 | 0/0 | 1/1 | 0/0 | 1/0 |
Métissage complexe | 9/2 | 7/5 | 5/4 | 3/1 | 1/0 | 0/0 | 1/1 |
Total | 4 649/957 | 1 415/ 1 044 | 583/218 | 491/349 | 454/ 528 | 189/205 | 72/68 |
Aperçu des données cliniques – 10e édition du GP2 (sur VWB) | ||
Données cliniques | N, ID unique | N, ID avec suivi |
Âge au moment du prélèvement de l’échantillon | 71 747 | – |
Âge au moment de l’apparition | 38 718 | – |
Âge au moment du diagnostic | 31 667 | – |
Historique familial de base | 92 021 | – |
Démographie | 26 701 | – |
Echelle de Hoehn et Yahr | 11 486 | 5 515 |
Score UPDRS Partie 1 | 2 359 | 1 057 |
Score UPDRS Partie 2 | 2 338 | 1 049 |
Score UPDRS Partie 3 | 3 606 | 1 084 |
Score UPDRS Partie 4 | 1 739 | 1 090 |
Score MDS UPDRS Partie 1 | 5 168 | 2 802 |
Score MDS UPDRS Partie 2 | 5 242 | 2 854 |
Score MDS UPDRS Partie 3 | 7 532 | 2 870 |
Score MDS UPDRS Partie 4 | 2 479 | 1 016 |
MOCA | 9 500 | 2 753 |
MMSE | 1 954 | – |
Score TCSP | 3 986 | 3 290 |
Traumatisme crânien | 5 495 | 3 747 |
Signes vitaux | 5 895 | 4 035 |
Odorat | 5 200 | 1 466 |
Accès aux données
Echantillons RGPD strictement locaux via Verily Viewpoint Workbench Nous sommes heureux d’annoncer que certains utilisateurs pourront avoir accès aux échantillons restreints localement, également dénommés échantillons régis par le Règlement général sur la protection des données (RGPD), grâce à notre collaboration avec Verily Viewpoint Workbench. A ce stade, alors que le GP2 continue de déployer des solutions de partage des données protégées par le RGPD, la dixième édition ne sera disponible que pour les membres du consortium GP2 et ses partenaires. Au fur et à mesure que les tests et la mise en œuvre se poursuivent, en 2025, ces solutions seront mises à la disposition d’un plus grand nombre de chercheurs. Tous les échantillons de la dixième édition se trouvent sur Workbench, tandis que tous les autres qui ne sont pas régis par le RGPD sont disponibles sur Terra (comme pour les éditions précédentes). Pour avoir accès à l’intégralité de l’édition sur VWB, vous devez :
- Disposer d’une autorisation d’accès GP2 de catégorie 2
- Remplir le formulaire de demande d’échantillons régis par le RGPD.
- Être membre du consortium GP2 (contribution de cohorte, partenaire GP2 ou membre de l’équipe d’analyse de projets).
Les futures éditions de données contribueront à renforcer la diversité des participants disponibles. Vous pouvez consulter notre tableau de bord pour suivre nos progrès. Les utilisateurs ayant un accès de catégorie 2 peuvent d’ores et déjà explorer les données sur notre navigateur de cohortes, dont nous avons parlé dans un précédent blog. Comme toujours, veuillez consulter le document README qui accompagne chaque édition du GP2 pour obtenir plus d’informations sur le contrôle de qualité, les canaux, les données et les analyses !