{"id":50011874,"date":"2021-05-24T20:26:04","date_gmt":"2021-05-25T00:26:04","guid":{"rendered":"https:\/\/gp2-stage-updated.local\/gwas-verstehen-teil-2-weitere-erkenntnisse-und-tipps\/"},"modified":"2024-11-13T22:34:15","modified_gmt":"2024-11-14T03:34:15","slug":"gwas-verstehen-teil-2-weitere-erkenntnisse-und-tipps","status":"publish","type":"post","link":"https:\/\/gp2.org\/de\/gwas-verstehen-teil-2-weitere-erkenntnisse-und-tipps\/","title":{"rendered":"GWAS verstehen: Teil 2 \u2013 Weitere Erkenntnisse und Tipps"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">In unserem letzten <\/span><a href=\"https:\/\/gp2.org\/understanding-gwas\/\"><span style=\"font-weight: 400;\">Blogbeitrag<\/span><\/a><span style=\"font-weight: 400;\"> haben wir eine Einf\u00fchrung in die GWAS gegeben und dabei statistische Formeln, Arbeitsabl\u00e4ufe und Beispiele aus der j\u00fcngsten GWAS f\u00fcr die Parkinson-Krankheit vorgestellt. Nun m\u00f6chten wir Ihnen zus\u00e4tzliche Einblicke und Tipps f\u00fcr die Durchf\u00fchrung Ihrer eigenen GWAS geben.<\/span><\/p>\n<p><b>Qualit\u00e4tskontrolle und Imputationsverfahren<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Qualitativ hochwertige Genotypen (nicht-palindromisch, d. h. m\u00f6glichst kein A\/T, G\/C, mit hohem Illumina Gentrain Score zur Clusterqualit\u00e4t) mit geringer Missingness (vorzugsweise <\u00a01\u00a0% pro Probe und pro SNP).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Konzentrieren Sie sich grunds\u00e4tzlich auf verbreitete Frequenzen des selteneren Allels (Minor Allele Frequencies, MAF) >\u00a01\u00a0%, bei geringerem Wert ist zu hoffen, dass das Genotyp-Cluster gut aussieht (sollte \u00fcberpr\u00fcft werden).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">\u00dcberpr\u00fcfen Sie die Proben auf hohe Heterozygotieraten, da dies auf eine m\u00f6gliche Kontamination hinweisen k\u00f6nnte. Niedrige Heterozygotieraten k\u00f6nnen ebenfalls problematisch sein.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Vorsicht bei duplizierten Proben und kryptisch verbundenen Proben.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">\u00dcberpr\u00fcfen und parsen Sie die Proben algorithmisch auf genetische Abstammung (wir arbeiten mit einer Kombination aus <\/span><a href=\"https:\/\/rajanil.github.io\/fastStructure\/\"><span style=\"font-weight: 400;\">fastStructure <\/span><\/a><span style=\"font-weight: 400;\">und <\/span><a href=\"https:\/\/github.com\/gabraham\/flashpca\"><span style=\"font-weight: 400;\">flashPCA<\/span><\/a><span style=\"font-weight: 400;\">). Die Vielfalt sollte m\u00f6glichst gro\u00df sein, dabei jedoch die Substruktur der Bev\u00f6lkerung und deren Auswirkung auf die Analyseergebnisse ber\u00fccksichtigt werden.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Achten Sie auf SNPs, die nicht zuf\u00e4llig fehlen, einschlie\u00dflich Verzerrungen durch Fehlen bei Fall-Kontroll-Status oder Haplotyp.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Es gibt keinen Grund, warum man nicht verschiedene Imputationsreferenzpanels f\u00fcr eine einzige Population verwenden und den Genotyp mit der besten Qualit\u00e4tsmetrik ausw\u00e4hlen sollte. Dies ist besonders n\u00fctzlich bei gemischten Stichprobenpopulationen.<\/span><\/li>\n<\/ul>\n<p><b>Tipps zu Studienniveauanalysen<\/b><b><br \/>\n<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Regression \u2013 Bei der GWAS werden zumeist lineare Regressionsmodelle f\u00fcr kontinuierliche Ergebnisse und logistische Modelle f\u00fcr diskontinuierliche Ergebnisse verwendet. Diese quantifizieren das Risiko bei einem SNP unter Ber\u00fccksichtigung von Kovariaten.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Mit verschiedenen Softwarepaketen k\u00f6nnen gemischte lineare Modelle ausgef\u00fchrt werden, bei denen Verwandtschaft und feinskalige Populationssubstrukturen genau ber\u00fccksichtigt werden k\u00f6nnen.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Hauptkomponenten \u2013 Durch die Berechnung von Hauptkomponentenladungen auf der Grundlage genomweiter Genotypisierungsdaten erhalten Sie einen n\u00fctzlichen Satz von Kovariaten f\u00fcr Ihre Regressionsmodelle, dank derer Sie die Substruktur der Population ber\u00fccksichtigen k\u00f6nnen.<\/span><\/li>\n<\/ul>\n<p><b>Lassen Sie uns nun eine Metaanalyse durchf\u00fchren<\/b><b><br \/>\n<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Fixed vs. Random \u2013 Dies sind Meta-Analyse-Methoden zur Kombination von Daten auf der Ebene einer zusammenfassenden Statistik, \u00fcber Datensilos und\/oder Publikationen hinweg. Fixed-Effects-Metaanalysen sind oft n\u00fctzlich f\u00fcr entdeckende Analysen und im Allgemeinen aussagekr\u00e4ftiger. Manche arbeiten jedoch lieber mit Random-Effects-Modellen, da sie konservativer sind und die Heterogenit\u00e4t verschiedener Datensilos ber\u00fccksichtigen.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Sch\u00e4tzung der Heterogenit\u00e4t \u2013 H\u00e4ufig ausgedr\u00fcckt in Cochrane&#8217;s\u00a0Q oder I2. Sehr wichtig, denn dadurch erh\u00e4lt man einen Eindruck von der Verzerrung durch Ausrei\u00dfereffekte und von der Verallgemeinerbarkeit der Ergebnisse.<\/span><\/li>\n<\/ul>\n<p><b>Ergebnisse der Pr\u00fcfung<\/b><b><br \/>\n<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Lambda-Werte in der Studie \u2013 sollten zwischen 0,95 und 1,05 liegen, ansonsten hat man ein Problem.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Gesamt-Lambda und Lambda\u00a01000 \u2013 Die Berechnung von Lambda-Werten auf Studien- oder Metaanalyse-Ebene kann schwierig sein, wenn ein Fall-Kontroll-Ungleichgewicht besteht. Durch exzessive Kontrollen kann die Lambda-Statistik k\u00fcnstlich aufgebl\u00e4ht werden. Verwenden Sie in diesem Fall Lambda 1000, denn der Wert ist auf 1000\u00a0F\u00e4lle und 1000\u00a0Kontrollen bezogen. Wie gesagt, der Code hierf\u00fcr findet sich in unserem GitHub Repository.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Linkage Disequilibrium (LD) Score Intercept \u2013 Alternative\/Erg\u00e4nzung zum Lambda-Wert und robuster gegen\u00fcber der LD-Struktur und dem Fall-Kontroll-Ungleichgewicht.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">LD-Spitzen in gleichf\u00f6rmigen Punktdiagrammen \u2013 das ist relativ eindeutig. Ihre Ergebnisse sollten als Punktdiagramm wie die Skyline von Manhattan (oder die Skyline der Stadt Ihrer Wahl \u2013 Sorry, D.C.!) aussehen, nicht wie ein Schneesturm.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Replikation \u2013 immer gut, aber manchmal hat man keine Datens\u00e4tze zur Verf\u00fcgung. Wenn keine zus\u00e4tzlichen Daten verf\u00fcgbar sind, versuchen Sie es mit einer Kombination aus Leave-One-Out-Metaanalyse und Kreuzvalidierung.<\/span><\/li>\n<\/ul>\n<p><b>Einige Analysen nach der GWAS<\/b><b><br \/>\n<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Oder: \u201eWas kommt nach der GWAS-Metaanalyse?\u201c Zur Information: GP2 wird weitere Blogbeitr\u00e4ge und Kurse zu diesen Themen anbieten.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Bedingte Analysen \u2013 Verwenden Sie den signifikantesten SNP in einer Region als Kovariate und f\u00fchren Sie die Analysen erneut durch oder verwenden Sie das Tool <\/span><a href=\"https:\/\/cnsgenomics.com\/software\/gcta\/#Overview\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GCTA<\/span><\/a><span style=\"font-weight: 400;\">. Eventuell gibt es mehrere unabh\u00e4ngige Signale pro Locus.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Feinkartierung \u2013 Dies kann durch eine approximative Bayes-Faktor-Analyse in Paketen wie <\/span><a href=\"https:\/\/github.com\/chr1swallace\/coloc\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">coloc <\/span><\/a><span style=\"font-weight: 400;\">einschlie\u00dflich Bayesscher Kollokation erfolgen (unter Nutzung von genomischen Referenzdaten f\u00fcr Genexpression oder \u00e4hnlichen Messgr\u00f6\u00dfen).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Prognosegewichtung und TWAS \u2013 Es gibt eine Reihe von Paketen zur Nutzung externer Gewichtungen aus Genexpressions-, Methylierungs- oder Chromatinstudien usw., um mutma\u00dflich mechanistisch verbundene Gene zu identifizieren, die sich in Ihren GWAS-Daten verstecken.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">ML &#8211; Zweckgebundene Prognosen; unser Lieblingspaket ist <\/span><a href=\"https:\/\/genoml.github.io\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GenoML<\/span><\/a><span style=\"font-weight: 400;\">, denn es ist weitestgehend automatisiert und macht maschinelles Lernen (ML) in der Genomik einfach.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">Zur weiteren Information finden sich unser Code und die Pipelines im <\/span><a href=\"https:\/\/github.com\/GP2code\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GP2 GitHub<\/span><\/a><span style=\"font-weight: 400;\">.<\/span><\/p>\n<p>Dieser Blogbeitrag wurde gemeinschaftlich von Hampton Leonard, Mike Nalls, Yeajin Song und Dan Vitale verfasst. Wenn Sie mehr \u00fcber die Autoren erfahren m\u00f6chten, besuchen Sie gerne die Webseite der GP2 <a href=\"\/working-groups\/complex-disease-data-analysis-working-group\/\">Complex Disease \u2013 Data Analysis Working Group<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im Nachgang zum letzten Blogbeitrag \u201eGWAS verstehen\u201c hat die GP2 Complex Disease Data Analysis Working Group praktische Tipps und Erkenntnisse zur Durchf\u00fchrung eigener GWAS bereitgestellt.<\/p>\n","protected":false},"author":16,"featured_media":50019562,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":"","_links_to":"","_links_to_target":""},"class_list":["post-50011874","post","type-post","status-publish","format-standard","hentry","post-type-blog-de","topic-genetik-komplexer-krankheit-de"],"acf":[],"_links":{"self":[{"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/posts\/50011874","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/users\/16"}],"replies":[{"embeddable":true,"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/comments?post=50011874"}],"version-history":[{"count":0,"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/posts\/50011874\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/media\/50019562"}],"wp:attachment":[{"href":"https:\/\/gp2.org\/de\/wp-json\/wp\/v2\/media?parent=50011874"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}