Die Komponenten der siebten Datenfreigabe von GP2
Zurück zu Blogs

Die Komponenten der siebten Datenfreigabe von GP2

Um Mike A. Nalls, Hampton Leonard, Mary B. Makarious, Dan Vitale, Zih-Hua Fang, Justin C. Solle, Mathew Koretsky, Kristin Levine, und Lietsel Jones | , , |
Author(s)
  • Mike A. Nalls, PhD

    Data Tecnica International | USA

    Mike gründete Data Tecnica Anfang 2017, nachdem er mehr als zehn Jahre Erfahrung in der Analyse großer Datensätze und Methodenforschung im Gesundheitswesen und anderen wissenschaftlichen Bereichen gesammelt hatte. Über 350 von Experten begutachtete Publikationen (vor dem 40. Lebensjahr) auf dem Gebiet der angewandten Statistik bei großen Datensätzen, Gehirnkrankheiten u... Read More

  • Hampton Leonard, MS

    Data Tecnica International/National Institutes of Health | USA

    Hampton verfügt über einen Hintergrund in Datenwissenschaft und maschinellem Lernen, den sie auf große Multi-Omik-Datensätze im Bereich neurodegenerativer Erkrankungen anwendet. Ihre Leidenschaft gilt der Erforschung von Unterschieden im klinischen Bereich und im Bereich der -Omics sowie der Frage, wie sich diese Unterschiede auf die Ergebnisse klinischer Studien auswirken ... Read More

  • Mary B. Makarious, BSc

    National Institutes of Health | USA

    Mary befindet sich im Aufbaustudium im Laboratory of Neurogenetics (LNG) am National Institutes of Health, National Institute on Aging bei Dr. Andrew Singleton und Mike Nalls. Sie studierte Bioinformatik und Neurowissenschaften an der Loyola University in Chicago, IL, USA, und ist nun seit zwei Jahren beim LNG. Bei ihrer Arbeit wendet sie Techniken des maschinellen Lernens und ... Read More

  • Dan Vitale, MS

    Data Tecnica International | USA

    Dan ist datenwissenschaftlicher Berater für Data Tecnica International. Er berät hauptsächlich das Laboratory of Neurogenetics am National Institute on Aging der National Institutes of Health. Sein Arbeitsschwerpunkt liegt auf Open Science, Automatisierung und Entwicklung von Genanalyse-Pipelines und -Software sowie maschinellem Lernen. E-Mail: [email protected]

  • Zih-Hua Fang, PhD

    Deutsches Zentrum für Neurodegenerative Erkrankungen (DZNE) | Deutschland

    Zih-Hua schloss ihr Bachelorstudium in Taiwan ab, promovierte an der Universität Wageningen in den Niederlanden und der AgroParisTech in Frankreich und absolvierte ihre Postdoktorandenausbildung an der ETH Zürich. Ihre Forschungsinteressen und -erfahrungen konzentrieren sich auf Züchtungsgenetik und -genomik im Bereich Tierzucht. Zia-Hua hat sechs Jahre Erfahrung in Bioinfor... Read More

  • Justin Solle

    Justin C. Solle, MBA

    Michael J. Fox Foundation | USA

    Justin kam 2021 als Senior Associate Director zur Michael J. Fox Foundation for Parkinson's Research. Er leitet schwerpunktmäßig das Global Parkinson's Genetics Program und unterstützt ferner Betrieb und Rekrutierung für die Parkinson's Progression Markers Initiative. E-Mail: [email protected]

  • Mathew Koretsky, BSc

    National Institutes of Health | USA

    Mathew ist Postgraduierten-Stipendiat am Center for Alzheimer’s Disease and Related Dementias an den National Institutes of Health. In seiner Arbeit konzentriert er sich auf die Entwicklung genetischer Datenverarbeitungspipelines sowie die Anwendung maschineller Lern- und Datenwissenschaftstechniken auf genomische Datensätze im Bereich neurodegenerativer Erkrankungen.

  • Kristin Levine, MS

    Data Tecnica International | USA

    Kristin ist Datenwissenschaftlerin bei Data Tecnica International und ist als Consultant primär für das Center for Alzheimer's and Related Dementias (CARD) an den National Institutes of Health tätig. Ursprünglich ist sie Schriftstellerin, wurde dann zur Datenwissenschaftlerin und setzt sich leidenschaftlich für offene Wissenschaft, die Demokratisierung von Forschungstools ... Read More

  • Lietsel Jones

    DataTecnica/National Institutes of Health | USA

    Lietsel ist Analytikerin bei Data Tecnica. Sie interessiert sich sehr für die Schnittstelle zwischen Epidemiologie und Genetik. Daneben ist sie als Managerin für klinische Daten für GP2 tätig und arbeitet an der Erfassung und Harmonisierung großer klinischer Datensätze, die von Beteiligten aus der ganzen Welt stammen.

Übersicht

Im April 2024 kündigte GP2 die siebte Datenfreigabe in Kooperation mit AMP® PD auf der Terra- und der Verily-Plattform an. Diese Freigabe umfasst über 9000 zusätzliche genotypisierte Teilnehmende.

  • Die Genotyp-Array-Daten, einschließlich Proben mit lokalen Einschränkungen, umfassen nun insgesamt 54.180 genotypisierte Teilnehmende (28.729 mit Parkinson-Erkrankung, 15.834 Kontrollpersonen und 9617 „sonstige“ Phänotypen).
    • Abzüglich der Proben mit lokalen Einschränkungen beträgt die Zahl nun 40.740 (20.507 mit Parkinson-Erkrankung, 11.841 Kontrollpersonen und 8.392 „sonstige“ Phänotypen).
  • Zu 17.496 Personen mit tiefen klinischen Phänotypisierungsinformationen liegen auch passende genetische Informationen vor.

Was ist in dieser Freigabe neu?

  • Zusätzliche genotypisierte und imputierte Proben
  • Zusätzliche klinische Daten für rund 4.911 Personen

DSGVO-Proben mit lokalen Einschränkungen über die Verily Viewpoint Workbench

Im Rahmen unserer Zusammenarbeit mit der Verily Viewpoint Workbench setzen wir das Pilotprojekt zur Gewährung eines Zugangs zu lokal eingeschränkten Proben (d. h. Proben, die unter die Allgemeine Datenschutzverordnung, DSGVO, fallen) fort.

Da GP2 aktuell weiter an Lösungen für den Austausch DSGVO-geschützter Daten arbeitet, sind Daten der 7. Freigabe mit regionalen Einschränkungen nur für Mitglieder des GP2-Forschungsverbunds sowie Partner verfügbar. Im Zuge der weiteren Tests und Implementierung Anfang 2024 wird diese Lösung dann der breiteren Forschungsgemeinde zur Verfügung stehen. Sämtliche Proben der 7. Freigabe sind auf der Workbench zu finden, während alle Proben der 7. Freigabe, die nicht den DSGVO-Anforderungen unterliegen, auf der Community Workbench auf Terra zu finden sind (so wie alle vorherigen Freigaben). Wenn Sie Zugang zur gesamten Freigabe auf VWB erhalten möchten, müssen Sie:

  1. über einen bewilligten GP2-Tier-2-Zugang verfügen,
  2. das Antragsformular für DSGVO-Proben ausfüllen,
  3. Mitglied des GP2-Forschungsverbunds sein (beitragende Kohorte, GP2-Partner oder Projektanalyse-Teammitglied),

Klinische Daten

Diese Freigabe enthält tiefe klinische Phänotypisierungsdaten für weitere 4.911 Personen. Diese Informationen umfassen: 

  • Alter bei Diagnose und Ausbruch
  • Primäre, aktuelle und letzte Diagnose
  • Kognitive Tests wie der Mini-Mental Status-Test (MMST) und der Montreal-Cognitive-Assessment-Test (MoCa)
  • Von der Movement Disorder Society gesponserte Überarbeitung der Unified Parkinson’s Disease Rating Scale (MDS-UPDRS)
  • Detaillierte „sonstige“ Phänotypen wie etwa Lewy-Körper-Demenz (LBD)

In dieser Freigabe liegen zu jeder der 17.496 Personen mit klinischen Informationen auch passende genetische Informationen vor.

Individuen-spezifische Daten:

Wir erfassen nun die Daten von insgesamt 87 Kohorten; 14 davon sind neu in dieser Freigabe. Weitere Informationen zu den bereitgestellten Kohorten finden Sie im GP2 Cohort Dashboard.

Die genetisch determinierte Abstammung von Array-genotypisierten GP2-Teilnehmenden wird in 11 Abstammungsgruppen gegliedert; die Tabelle unten gibt Aufschluss über die genetisch determinierte Abstammung der genotypisierten Teilnehmenden in dieser Freigabe, welche die Qualitätskontrolle durchlaufen haben und imputiert wurden. Diese Zahlen beinhalten Proben aus früheren Freigaben, die unter Verwendung der neuen Cluster-Datei erneut geclustert wurden und die Qualitätskontrolle durchlaufen haben, sowie die neu genotypisierten und gemeinsam genutzten Proben, die nur in dieser aktuellen Freigabe enthalten sind.

Gesamtgenom-Sequenzdaten mit Aufruf durch DeepVariant-GLnexus

Weitere GP2-Sequenzierungsdaten werden für das 3. Quartal 2024 erwartet.

Durch zukünftige Datenfreigaben wird sich die Vielfalt der verfügbaren Teilnehmenden weiter erhöhen. Auf unserem Cohort Dashboard können Sie sich über den Fortschritt unserer Arbeiten informieren. Wer bereits über einen Tier-2-Zugang verfügt, kann die Daten in unserem Cohort Browser ansehen, der bereits in einem früheren Blogbeitrag vorgestellt wurde.

Wie immer finden Sie weitere Details zu Pipelines, Daten und Analysen in der README-Datei zur jeweiligen GP2-Freigabe!