Die Komponenten der 9. Datenfreigabe von GP2

Dezember 20, 2024

Von Hampton Leonard, Mike A. Nalls, Dan Vitale, Mathew Koretsky, Kristin Levine, Mary B. Makarious, Lietsel Jones, Zih-Hua Fang und J C. Solle

Übersicht

Im Dezember 2024 kündigte GP2 die 9. Datenfreigabe in Kooperation mit AMP® PD auf der Terra-Plattform und der Verily®-Workbench an. Diese Freigabe umfasst über 17.690 zusätzliche genotypisierte Teilnehmende.

  • Die Genotyp-Array-Daten, einschließlich Proben mit lokalen Einschränkungen, umfassen nun insgesamt 71.835 genotypisierte Teilnehmende (31.985 mit Parkinson-Erkrankung, 18.249 Kontrollpersonen und 21.601 „sonstige“ Phänotypen).
    • Abzüglich der Proben mit lokalen Einschränkungen beträgt die Zahl nun 55.305 (23.709 mit Parkinson-Erkrankung, 13.404 Kontrollpersonen und 18.192 „sonstige“ Phänotypen).
  • Von den 71.835 Proben mit genotypisierten Daten:
    • liegen für 16.800 Personen ebenfalls tiefe klinische Phänotypisierungsinformationen vor (8. Freigabe)
    • liegen für 10.454 Personen ebenfalls klinische Exom-Informationen vor (8. Freigabe)
    • liegen für insgesamt 7.732 Personen ebenfalls WGS-Daten vor (8. Freigabe)

Was ist in dieser Freigabe neu?

  • Zusätzliche Daten:
    • Mit der 9. Freigabe haben wir 17.690 genotypisierte Teilnehmende hinzugefügt.
      • Für Forschende, die ihre Rohdaten lieber gespiegelt und aligned erhalten möchten, stellen wir zusätzlich zu den raw_genotypes auch raw_genotypes_flipped bereit.
    • Proben-Identifikatoren:
      • Das Präfix „m-“ für Kohorten, die ursprünglich über das Monogenic Network rekrutiert wurden, wird bereits nicht mehr verwendet.
      • Das Suffix „_s*“ für die Benennung von GP2-Proben wird ab jetzt nicht mehr verwendet. Die Probennummer ist über den Master-Key weiterhin verfügbar, um einen Abgleich mit früheren Freigabe-IDs zu ermöglichen, aber GP2-Proben-IDs in den genetischen Dateien werden kein Suffix „_s*“ mehr enthalten.
      • Die PPMI-GP2-IDs in allen Dateien wurden aktualisiert und enthalten nun ihre PATNO-ID, um plattformübergreifend arbeitenden Forschenden die Arbeit zu erleichtern.

DSGVO-Proben mit lokalen Einschränkungen über die Verily Viewpoint Workbench Wir stellen über unsere Zusammenarbeit mit der Verily Viewpoint Workbench weiterhin einen Pilotzugang zu lokal begrenzten Proben bereit, d. h. Proben, die der Datenschutzgrundverordnung (DSGVO) unterliegen. Während GP2 weiter an Lösungen für den Austausch DSGVO-geschützter Daten arbeitet, sind die Daten mit regionalen Einschränkungen der 9. Freigabe nur für Mitglieder des GP2-Forschungsverbunds sowie Partner verfügbar. Im Zuge der weiteren Test- und Implementierungsphase im Jahr 2024 wird diese Lösung dann der breiteren Forschungsgemeinschaft zur Verfügung gestellt. Sämtliche Proben der 9. Freigabe sind auf der Workbench zu finden, während alle Proben der 9. Freigabe, die nicht den DSGVO-Anforderungen unterliegen, auf der Community Workbench auf Terra zu finden sind (so wie alle vorherigen Freigaben). Wenn Sie Zugang zur gesamten Freigabe auf der VWB erhalten möchten, müssen Sie:

  1. über einen bewilligten GP2-Tier-2-Zugang verfügen
  2. das Antragsformular für DSGVO-Proben ausfüllen
  3. Mitglied des GP2-Forschungsverbunds sein (beitragende Kohorte, GP2-Partner oder Projektanalyse-Teammitglied)

Klinische Daten Diese Freigabe enthält klinische Daten von insgesamt 71.835 Personen, für die genetische und klinische Kerndaten verfügbar sind. Die Freigabe umfasst tiefe klinische Phänotypisierungs- und genetische Daten für 16.800 Personen. Diese Informationen beinhalten:

  • Alter bei Diagnose und Ausbruch
  • Primäre, aktuelle und letzte Diagnose
  • Kognitive Tests wie z. B. Mini-Mental Status-Test (MMST) und Montreal-Cognitive-Assessment-Test (MoCa)
  • Von der Movement Disorder Society gesponserte Überarbeitung der Unified Parkinson’s Disease Rating Scale (MDS-UPDRS)
  • Detaillierte „sonstige“ Phänotypen wie etwa Lewy-Körper-Demenz (LBD)
  • Über das Monogenic Network rekrutierte Fälle werden als „sonstige“ kodiert.

Individuen-spezifische Daten Wir erfassen nun die Daten von insgesamt 104 Kohorten. Weitere Informationen zu den bereitgestellten Kohorten finden Sie im GP2 Cohort Dashboard. Die genetisch determinierte Abstammung von Array-genotypisierten GP2-Teilnehmenden wird in 11 Abstammungsgruppen gegliedert; die Tabelle unten gibt Aufschluss über die genetisch determinierte Abstammung der genotypisierten Teilnehmenden in dieser Freigabe, die die Qualitätskontrolle durchlaufen haben und imputiert wurden. Diese Zahlen spiegeln Proben aus früheren Freigaben wider, die unter Verwendung der aktualisierten Clusterdatei neu geclustert und einer Qualitätskontrolle unterzogen wurden, sowie neu genotypisierte Proben, die ausschließlich in dieser Freigabe enthalten sind. Durch zukünftige Datenfreigaben wird sich die Vielfalt der verfügbaren Teilnehmenden weiter erhöhen. Auf unserem Dashboard können Sie sich über den Fortschritt unserer Arbeiten informieren. Wenn sie bereits über einen Tier-2-Zugang verfügen, können Sie die Daten in unserem Cohort Browser ansehen, der bereits in einem früheren Blogbeitrag vorgestellt wurde. Wie immer finden Sie weitere Details zu den Themen Qualitätskontrolle, Pipelines, Daten und Analysen in der README-Datei zur jeweiligen GP2-Freigabe!

Treffen Sie die Autoren

Leiterin Kooperationsforschung

Hampton Leonard

National Institute on Aging/National Institutes of Health | USA

Berater

Mike A. Nalls, PhD

National Institutes of Health | USA

Datenwissenschaftler

Dan Vitale

National Institutes of Health | USA

Daten- und Software-Ingenieur

Mathew Koretsky, BSc

National Institutes of Health | WA

Datenwissenschaftlerin

Kristin Levine, MSc

Data Tecnica International | USA

Biomedizinische Datenwissenschaftlerin, Contractor

Mary B. Makarious, PhD

National Institutes of Health | Washington D.C.

Klinische Datenanalystin

Lietsel Jones, MSc

Data Tecnica International | Bethesda

Wissenschaftlerin

Zih-Hua Fang, PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | USA