Im Focus: Einführung des neuen GP2 Cohort Browsers

August 16, 2023

Von GP2-Arbeitsgruppe Complex Disease - Data Analysis (Komplexe Krankheit - Datenanalyse)

Sinn und Zweck des GP2-Programms ist es, unser Verständnis der genetischen Grundlagen der Parkinson-Krankheit erheblich zu erweitern und diesem Wissen auch weltweit Relevanz zu verleihen. Unser Weg dorthin führt über den Aufbau einer globalen Forschungsgemeinde, die über die notwendigen Instrumente und Infrastrukturen verfügt, um aufkommendem Forschungsbedarf und Fragestellungen gerecht zu werden. In diesem Zusammenhang möchten wir nun unsere neueste Anwendung vorstellen: den GP2 Cohort Browser. Mit diesem revolutionären Tool entsteht eine interaktive Plattform, auf der die Teilnehmenden der GP2-Kohorte und die Forschenden effizient und benutzerfreundlich den reichhaltigen Bestand an genomischen Daten erschließen können. The GP2 Cohort Browser wurde entwickelt, um denjenigen, die mit individuellen genetischen Daten von GP2 arbeiten, eine nahtlose und umfassende Datennutzung zu ermöglichen. Um Zugang zu diesen Datensätzen zu erlangen und unser Tool zu nutzen, muss man über eine genehmigte Tier-2-GP2-Datenvereinbarung verfügen. Diese Vereinbarung können Sie hier beantragen: https://amp-pd.org/register-for-amp-pd. Mehr über das Antragsverfahren erfahren Sie hier

Nachfolgend finden Sie eine Übersicht über das neue Tool, das Sie sofort erkunden können, sobald Sie unsere Datennutzungsvereinbarung unterzeichnet haben! 

Den Browser finden Sie hier: https://gp2-cohort-browser-dot-gp2-release-terra.uc.r.appspot.com/

 

Landing Page 

Die Landing Page ist Ihr Ausgangspunkt. Hier findet sich eine Übersicht aller Funktionen der Web-Anwendung. Es legt den Grundstein für die Informationen, die Sie erkunden können, und bietet eine kleine Vorschau auf das, was Sie erwarten können, von Maßnahmen zur Qualitätskontrolle bis hin zur Aufschlüsselung der Abstammung.

Umfassende Metadaten-Aufschlüsselung (Metadata)

Mit dieser Anwendung erhalten Forschende Zugriff auf eine vollständige Metadaten-Aufschlüsselung einschließlich Histogrammen. Demografische Merkmale von Kohorten wie Alter, Geschlecht und Phänotyp können hier detailliert ausgewertet werden. Benutzer können auswählen, welche Kohorte sie untersuchen möchten.

Qualitätskontrolle (QC – Quality Control)

Ein zentrales Merkmal des GP2 Cohort Browser ist die strikte Qualitätskontrolle. Hier erhalten Sie Zugang und Einblicke in unsere Prozesse zur Qualitätskontrolle, einschließlich Filterung auf Proben- und Variantenebene. Auch können Sie im Dropdown-Bereich den aktuellen Stand der Beschreibung der Qualitätskontrolle im Detail nachlesen. Das Trichterdiagramm visualisiert den Qualitätskontrollprozess Schritt für Schritt und ermöglicht Ihnen so ein besseres Verständnis Ihrer Daten.

Abstammungsanalyse (Ancestry Analysis)

Zum GP2 Cohort Browser gehört eine dynamische Darstellung der 3D Principal Component Analysis (PCA), mit der sich die genetische Abstammung interaktiv überprüfen lässt. Das Diagramm beinhaltet Referenzpanels und ermöglicht eine Untergliederung nach vorhergesagter Abstammung. Unter dem Diagramm findet sich eine Tabelle mit der vorhergesagten Abstammung und ein Tortendiagramm zur Illustration der Verteilung. Die Anwendung liefert auch Metriken zur Leistung des Modells wie Konfusionsmatrix, Genauigkeit und F1Score.

In der nächsten Version (voraussichtliche Veröffentlichung im Frühherbst 2023) können wir uns auf die Erweiterung der Admixture-Funktion für das Referenzpanel freuen, mit einem Schwerpunkt auf gemischten Bevölkerungsgruppen wie der indianischen/lateinamerikanischen (AMR), der nahöstlichen (MDE) und zentralasiatischen (CAS) Bevölkerung.

SNP-Messgrößen (SNP-Metrics)

Forschende haben die Möglichkeit, nach der Auswahl einer Abstammung die Metriken der Einzelnukleotid-Polymorphismen (SNP) für die neueste Freigabe zu untersuchen. Man kann das Cluster-Diagramm nach rsID oder Position (in hg38) durchsuchen. Dieser Abschnitt enthält auch den GenTrain-Score und die Verteilung der Minor-Allel-Häufigkeit für Kontroll- und Krankheitsgruppen. 

In unseren zukünftigen Versionen können Sie sich auf eine Erweiterung der vorhergesagten Cluster für Varianten mit niedrigerer Auflösung unter Verwendung unseres benutzerdefinierten maschinellen Lernansatzes freuen. 

Seltene Varianten (Rare Variants)

Der GP2 Cohort Browser verfügt auch über einen speziellen Bereich zur Erforschung seltener Varianten. Hier finden sich Informationen aus dem Monogenic Network von GP2, wo bekannte Parkinson-Gene in einer Untergruppe zusammengefasst werden können, um diese genauer zu untersuchen. Über den Seitenleistenfilter können Nutzer nach bestimmten Genen suchen, während die Tabelle umfassende Daten zu allen anderen Aspekten bereitstellt.

Fazit

Wir hoffen sehr, dass der GP2 Cohort Browser Ihnen dabei hilft, die im Rahmen von GP2 verfügbaren Daten besser zu verstehen sowie Übersichten für Vorträge und Poster zu erstellen. 

Der GP2 Cohort Browser, der über alle Releases und Kohorten hinweg einheitlich ist, stellt einen mutigen Schritt nach vorn dar und erhöht die Transparenz und Zugänglichkeit in Bezug auf jeden Schritt des QC-Prozesses innerhalb von GP2. Wir danken allen Kohorten auf der ganzen Welt, die Daten für das GP2-Programm gespendet und damit das ganze Projekt erst möglich gemacht haben. 

Bei Fragen oder für Unterstützung wenden Sie sich bitte an die Data Analysis Working Group [email protected] .

Treffen Sie die Autoren

GP2-Arbeitsgruppe Complex Disease - Data Analysis (Komplexe Krankheit - Datenanalyse)