Im Focus: Einführung des neuen GP2 Cohort Browsers
Zurück zu Blogs

Im Focus: Einführung des neuen GP2 Cohort Browsers

Um GP2-Arbeitsgruppe Complex Disease – Data Analysis (Komplexe Krankheit – Datenanalyse) | |
Author(s)
  • GP2-Arbeitsgruppe Complex Disease – Data Analysis (Komplexe Krankheit – Datenanalyse)

    |

    Dieser Blog-Beitrag stammt von Mitgliedern der GP2-Arbeitsgruppe Complex Disease - Data Analysis (Komplexe Krankheit - Datenanalyse): Hampton Leonard, Mike Nalls, Yeajin Song und Dan Vitale.

Sinn und Zweck des GP2-Programms ist es, unser Verständnis der genetischen Grundlagen der Parkinson-Krankheit erheblich zu erweitern und diesem Wissen auch weltweit Relevanz zu verleihen. Unser Weg dorthin führt über den Aufbau einer globalen Forschungsgemeinde, die über die notwendigen Instrumente und Infrastrukturen verfügt, um aufkommendem Forschungsbedarf und Fragestellungen gerecht zu werden. In diesem Zusammenhang möchten wir nun unsere neueste Anwendung vorstellen: den GP2 Cohort Browser. Mit diesem revolutionären Tool entsteht eine interaktive Plattform, auf der die Teilnehmenden der GP2-Kohorte und die Forschenden effizient und benutzerfreundlich den reichhaltigen Bestand an genomischen Daten erschließen können. The GP2 Cohort Browser wurde entwickelt, um denjenigen, die mit individuellen genetischen Daten von GP2 arbeiten, eine nahtlose und umfassende Datennutzung zu ermöglichen. Um Zugang zu diesen Datensätzen zu erlangen und unser Tool zu nutzen, muss man über eine genehmigte Tier-2-GP2-Datenvereinbarung verfügen. Diese Vereinbarung können Sie hier beantragen: https://amp-pd.org/register-for-amp-pd. Mehr über das Antragsverfahren erfahren Sie hier

Weiter unten folgt eine Übersicht über das neue Tool, das Sie gleich ausprobieren können, sobald Sie unsere Datennutzungsvereinbarung unterzeichnet haben. 

Zum Browser gelangen Sie hier: https://gp2-cohort-browser-dot-gp2-release-terra.uc.r.appspot.com/  

Landing Page 

Die Landing Page ist Ihr Ausgangspunkt. Hier findet sich eine Übersicht aller Funktionen der Web-Anwendung. Man erhält einen Eindruck, welche Informationen zur Verfügung stehen, und einen ersten Einblick in die verschiedenen Funktionen – von der Qualitätskontrolle bis hin zur Abstammungsaufschlüsselung.

Umfassende Metadaten-Aufschlüsselung (Metadata)

Mit dieser Anwendung erhalten Forschende Zugriff auf eine vollständige Metadaten-Aufschlüsselung einschließlich Histogrammen. Demografische Merkmale von Kohorten wie Alter, Geschlecht und Phänotyp können hier detailliert ausgewertet werden. Man kann auswählen, welche Kohorte man ansehen möchte.

Qualitätskontrolle (QC – Quality Control)

Ein zentrales Merkmal des GP2 Cohort Browser ist die strikte Qualitätskontrolle. Hier erhalten Sie Zugang und Einblicke in unsere Prozesse zur Qualitätskontrolle, einschließlich Filterung auf Proben- und Variantenebene. Auch können Sie im Dropdown-Bereich den aktuellen Stand der Beschreibung der Qualitätskontrolle im Detail nachlesen. Das Trichterdiagramm veranschaulicht den Qualitätskontrollprozess Schritt für Schritt, was ein besseres Verständnis der Daten ermöglicht.

Abstammungsanalyse (Ancestry Analysis)

Zum GP2 Cohort Browser gehört eine dynamische Darstellung der 3D Principal Component Analysis (PCA), mit der sich die genetische Abstammung interaktiv überprüfen lässt. Das Diagramm beinhaltet Referenzpanels und ermöglicht eine Untergliederung nach vorhergesagter Abstammung. Unter dem Diagramm findet sich eine Tabelle mit der vorhergesagten Abstammung und ein Tortendiagramm zur Illustration der Verteilung.

Die Anwendung liefert auch Metriken zur Leistung des Modells wie Konfusionsmatrix, Genauigkeit und F1Score. Beim nächsten Release (voraussichtlich Anfang Herbst 2023) ist eine Erweiterung im Bereich der Beimischung für das Referenzpanel geplant, mit Fokus auf Mischpopulationen wie Amerindian/Latino (AMR), Middle Eastern (MDE) und Central Asian (CAS).

SNP-Messgrößen (SNP-Metrics)

Forschende haben die Möglichkeit, nach der Auswahl einer Abstammung die Metriken der Einzelnukleotid-Polymorphismen (SNP) für die neueste Freigabe zu untersuchen. Man kann das Cluster-Diagramm nach rsID oder Position (in hg38) durchsuchen. Dieser Abschnitt enthält auch den GenTrain-Score und die Verteilung der Minor-Allel-Häufigkeit für Kontroll- und Krankheitsgruppen. 

Für die Zukunft steht eine Erweiterung zu den vorhergesagten Clustern für Varianten in geringerer Auflösung an. Hier soll unser spezieller Ansatz zum maschinellen Lernen zum Einsatz kommen.

Seltene Varianten (Rare Variants)

Der GP2 Cohort Browser verfügt auch über einen speziellen Bereich zur Erforschung seltener Varianten. Hier finden sich Informationen aus dem Monogenic Network von GP2, wo bekannte Parkinson-Gene in einer Untergruppe zusammengefasst werden können, um diese genauer zu untersuchen. Mit dem Filter in der Seitenleiste kann man nach bestimmten Genen suchen, während die Tabelle ausführliche Angaben zu allen anderen Aspekten enthält.

Fazit

Wir hoffen sehr, dass der GP2 Cohort Browser Ihnen dabei hilft, die im Rahmen von GP2 verfügbaren Daten besser zu verstehen sowie Übersichten für Vorträge und Poster zu erstellen. 

Der GP2 Cohort Browser, der über alle Freigaben und Kohorten hinweg einheitlich ist, bildet einen beherzten Schritt nach vorn, der die Transparenz und Zugänglichkeit für jeden Schritt in der GP2-Qualitätskontrolle erhöht. Wir danken allen Kohorten auf der ganzen Welt, die Daten für das GP2-Programm gespendet und damit das ganze Projekt erst möglich gemacht haben. 

Wenn Sie Fragen haben oder uns unterstützen möchten, wenden Sie sich bitte an die Arbeitsgruppe Data Analysis [email protected].