Eléments de la huitième édition des données du GP2
Retour aux blogs

Eléments de la huitième édition des données du GP2

Par Mike A. Nalls, Hampton Leonard, Mary B. Makarious, Dan Vitale, Zih-Hua Fang, Justin C. Solle, Mathew Koretsky, Kristin Levine, et Lietsel Jones | , , , |
Author(s)
  • Mike A. Nalls, docteur ès sciences

    Data Tecnica International | Etats-Unis

    Mike a fondé Data Tecnica au début de l’année 2017 après avoir passé plus de dix années à étudier méthodes et analyses de données dans le domaine des soins de santé et autres domaines scientifiques. Il compte à son actif plus de 350 publications scientifiques (avant l’âge de 40 ans) dans le domaine des statistiques appliquées aux grands jeux de données, malad... Read More

  • Hampton Leonard, diplômée en sciences

    Data Technica International / National Institutes of Health | Etats-Unis

    Hampton a un parcours dans le domaine des données scientifiques et de l’apprentissage machine qu’elle applique à de grands jeux de données multi-omiques dans le champ des maladies neurodégénératives. Elle se passionne pour la recherche sur ce qui distingue les niveaux cliniques et omiques et sur la façon dont ces différences influencent le résultat des essais clini... Read More

  • Mary B. Makarious, diplôme de sciences

    National Institutes of Health | EUA

    Mary est étudiante universitaire au Laboratoire de neurogénétique (LNG) des Instituts nationaux de la Santé, Institut national du vieillissement sous l’orientation Elle a étudié la bioinformatique et les neurosciences à l’Université Loyola, Chicago, EUA, avant de rejoindre le LNG, il y a deux ans. Son travaille consiste à appliquer l’apprentissage machine et les... Read More

  • Dan Vitale, diplômé en sciences

    Data Tecnica International | EUA

    Dan est consultant en données scientifiques chez Data Tecnica International, et collabore surtout avec le Laboratoire de neurogénétique à l’Institut national du vieillissement des Institut nationaux de la santé. Son travail porte sur la science ouverte, l’automatisation et le développement de flux et de logiciels d’analyses génétiques ainsi que l’apprentissage m... Read More

  • Zih-Hua Fang, docteur ès sciences

    German Center for Neurodegenerative Diseases | Allemagne

    Zih-Hua a fait sa licence à Taïwan, son doctorat à l'Université de Wageningen et à AgroParisTech en France, et son post-doctorat à l'ETH de Zurich. Ses domaines de recherche et son expérience sont centrés sur la génétique et la génomique de la reproduction animale. Zia-Hua dispose de six ans d'expérience en bioinformatique et en modélisation statistique, et est sp�... Read More

  • Justin Solle

    Justin C. Solle, MBA

    Michael J. Fox Foundation | Etats-Unis

    Brian occupe le poste de directeur associé sénior à la Fondation Michael J. Fox pour la recherche sur la maladie de Parkinson depuis 2021. Il dirige le Programme mondial sur la génétique de la maladie de Parkinson et se charge des opérations et du recrutement de l’Initiative sur les marqueurs d’évolution de la maladie de Parkinson. Email : [email protected]

  • Mathew Koretsky, diplômé en sciences

    National Institutes of Health | Etats-Unis

    Mathew est chercheur au Centre Alzheimer et maladies apparentées des National Institutes of Health. Ses travaux portent sur le développement de modes de traitement des données génétiques, sur l’application de l’apprentissage machine et des techniques de la science des données aux ensembles de données génomiques dans le cadre des maladies neurodégénératives.

  • Kristin Levine, master en sciences

    Data Tecnica International | Etats-Unis

    Kristin est scientifique des données auprès de Data Tecnica International et prête surtout un service de conseil au Centre Alzheimer et maladies apparentées (CARD) des National Institutes of Health. Écrivaine devenue scientifique de données, elle se passionne pour la science ouverte, la démocratisation des outils de recherche et pour rendre les données aussi claires et ... Read More

  • Lietsel Jones

    DataTecnica/National Institutes of Health | Etats-Unis

    Lietsel est analyste auprès de Data Tecnica et se concentre sur ce qui rapproche l’épidémiologie de la génétique. Elle est également chef de données cliniques auprès du GP2 et travaille à recueillir et harmoniser les larges bases de données cliniques des contributeurs du monde entier.

Aperçu général

En septembre 2024, le GP2 a annoncé la publication de la huitième édition des données sur les plateformes Terra et Verily® Workbench , en collaboration avec l’AMP® PD. Cette édition comprend 5 481 séquençages du génome entier et 10 454 séquençages d’exomes cliniques. La prochaine édition proposera d’autres génotypages.

  • Les données du séquençage du génome entier comprennent désormais un total de 7 734 participants séquencés (6 113 atteints de Parkinson, 617 cas témoins et 1004 « autres » phénotypes).
    • Si l’on soustrait les échantillons restreints, le nombre total atteint 4 713 participants (soit 4 098 cas de Parkinson, 390 cas témoins et 225 « autres » phénotypes).
    • Il convient de noter que les cas recrutés par l’intermédiaire du réseau monogénique sont classés dans la catégorie « Autres »
  • Par ailleurs, cette édition du WGS comprend une publication partielle des séquences du génome entier de deux cohortes de l’AMP® PD (BioFind et PPMI), lesquelles ont été regroupées avec celles du WGS du GP2 à des fins d’analyse. Au moyen d’un fichier de concordance d’identifiants inclus dans cette édition, il est possible de faire le lien entre les échantillons publiés et leurs identifiants de départ issus de l’AMP® PD.
  • Dans cette édition, le séquençage de l’exome clinique de 10 454 participants, issus de la Fondation pour la maladie de Parkinson, a été réalisé en cohortes regroupées.
  • Cette édition comprend les données cliniques de base de 62 087 personnes. Sur ce total, l’accès aux données de phénotype clinique profond et génétiques ets disponible pour 16 800 personnes.

Quoi de neuf dans cette publication?

  • Nouveaux échantillons de séquençage du génome entier du GP2 et ensembles de variants identifiés en cohortes, y compris les échantillons de deux cohortes d’AMP®PD (BioFind et PPMI).
  • Données cliniques sur l’exome de la Fondation pour la maladie de Parkinson
  • Données cliniques supplémentaires concernant les individus, portant le total à 62 087 individus pour lesquels des données cliniques de base sont disponibles. 

Echantillons restreints localement par le RGPD via Verily Viewpoint Workbench

Nous continuons à essayer, grâce à notre collaboration avec Verily Viewpoint Workbench, d’obtenir l’accès aux échantillons restreints localement, connus également comme étant des échantillons soumis au Règlement général sur la protection des données (RGPD). A ce stade, alors que le GP2 continue de déployer ses solutions de partage de données pour les données protégées par le RGPD, la huitième édition ne sera disponible que pour les membres du consortium GP2 et ses partenaires. Au fur et à mesure de la poursuite des tests et de la mise en œuvre, en 2024, ces solutions seront mises à la disposition d’un plus grand nombre de chercheurs. Tous les échantillons de la huitième édition sont disponibles sur Workbench. Cependant, les échantillons de la huitième édition non régis par le RGPD sont disponibles sur Terra (comme pour les éditions passées). Pour avoir accès à l’intégralité des publications sur VWB, vous devez :

  1. Disposer d’une autorisation d’accès GP2 de catégorie 2.
  2. Remplir le formulaire de demande d’échantillons régis par le RGPD.
  3. Être membre du consortium du GP2 (contribution de cohorte, partenaire GP2 ou équipe de projet d’analyses).

Données cliniques

Cette édition contient les données cliniques de 62 087 personnes dont les données génétiques et les données cliniques de base sont accessibles. Cette édition comprend les données précises du phénotype et des données génétiques de 16 800 personnes. Ces données incluent :

  • Âge au moment du diagnostique
  • Diagnostique primaire, actuel et suivant
  • Examens cognitifs tels que le Mini-Mental State Examination et le Montreal Cognitive Assessment
  • Révision de l’échelle UPDRS parrainée par la Movement Disorder Society
  • Détail des « autres » phénotypes, tels que la démence à corps de Lewy
  • Cas recrutés par l’intermédiaire du réseau monogénique classés dans la catégorie « Autres »

Séquençages d’exomes cliniques

Le séquençage de l’exome clinique, fourni par la Fondation pour la maladie de Parkinson, est disponible pour 10 454 échantillons dans cette édition et offre ainsi une analyse des régions codantes et des sites d’épissage de 4 717 gènes. Ce séquençage ciblé a pour but d’identifier et de signaler les variants susceptibles de présenter une importance clinique, en se concentrant sur ceux qui correspondent aux informations cliniques et aux antécédents familiaux du patient. Pour de plus amples informations, consultez la page Exome clinique de Fulgent Genetics..

Séquençage entier du génome appelé DeepVariant-GLnexus

L’outil DeepVariant de Google associé au GLnexus a été utilisé pour l’identification des variants en cohortes. DeepVariant est un outil d’appel des variants à apprentissage profond qui dépasse les outils les plus sophistiqués actuels en faisant un appel de variant génétique ciblé. Cela simplifie également le processus, tout en en renforçant la précision et la fiabilité.  Les participants au GP2 atteints de maladies complexes ont leur ascendance génétiquement déterminée et répartie en onze groupes ; le tableau ci-dessous détaille l’ascendance des participants à cette édition qui ont passé le contrôle de qualité et ont été comptabilisés. Ces chiffres inclus les échantillons des éditions précédentes qui ont été réorganisés selon une nouvelle méthode de classement des dossiers et ont été soumis à un contrôle qualité, ainsi que de nouveaux échantillons de génotypes, spécifiques à cette édition. Les futures diffusions de données contribueront à renforcer la diversité du groupe des participants disponibles. Vous pouvez consulter notre tableau de bord pour suivre nos progrès. Les utilisateurs ayant un accès de catégorie 2 peuvent d’ores et déjà explorer les données sur notre navigateur de cohortes, dont nous avons parlé dans un précédent blog


Comme toujours, veuillez consulter le document README qui accompagne chaque édition du GP2 pour obtenir plus d’informations sur le contrôle de qualité, les canaux, les données et les analyses !

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.