{"id":50011858,"date":"2021-05-24T20:26:04","date_gmt":"2021-05-25T00:26:04","guid":{"rendered":"https:\/\/gp2stg.wpenginepowered.com\/comprendre-les-etudes-dassociation-pangenomique-gwas-partie-2-notions-et-conseils-supplementaires\/"},"modified":"2024-10-21T15:05:14","modified_gmt":"2024-10-21T19:05:14","slug":"comprendre-les-etudes-dassociation-pangenomique-gwas-partie-2-notions-et-conseils-supplementaires","status":"publish","type":"post","link":"https:\/\/gp2.org\/fr\/comprendre-les-etudes-dassociation-pangenomique-gwas-partie-2-notions-et-conseils-supplementaires\/","title":{"rendered":"Comprendre les \u00e9tudes d\u2019association pang\u00e9nomique (GWAS) Partie 2 &#8211; Notions et conseils suppl\u00e9mentaires"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">Dans notre dernier <\/span><a href=\"https:\/\/gp2.org\/understanding-gwas\/\"><span style=\"font-weight: 400;\">blog<\/span><\/a><span style=\"font-weight: 400;\">, nous avons pr\u00e9sent\u00e9 les GWAS (\u00e9tudes d\u2019association pang\u00e9nomique) avec les formules statistiques, les flux de travail et les exemples de la derni\u00e8re \u00e9tude d\u2019association pang\u00e9nomique consacr\u00e9e \u00e0 la maladie de Parkinson. Cette fois-ci, nous souhaitons vous donner quelques notions et conseils suppl\u00e9mentaires pour lancer votre propre \u00e9tude pang\u00e9nomique.<\/span><\/p>\n<p><b>Contr\u00f4le de qualit\u00e9 et processus d\u2019imputation<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">G\u00e9notypes de haute qualit\u00e9 (non-palindrome, c-\u00e0-d non A\/T, G\/C si possible, avec un score Illumina \u00e9lev\u00e9 indiquant la qualit\u00e9 du groupe) avec peu de lacunes (&lt;% par \u00e9chantillon et par PSN, de pr\u00e9f\u00e9rence).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">De fa\u00e7on g\u00e9n\u00e9rale, concentrez-vous sur les fr\u00e9quences communes d\u2019all\u00e8les mineurs &gt;1%. S\u2019ils sont inf\u00e9rieurs, esp\u00e9rez que les groupes de g\u00e9notype soient prometteurs (vous devrez les v\u00e9rifier).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">V\u00e9rifiez si les \u00e9chantillons ont un fort taux d\u2019h\u00e9t\u00e9rozygotie car cela indique une contamination potentielle. Un taux d\u2019h\u00e9t\u00e9rozygotie feu \u00e9lev\u00e9 peut \u00e9galement s\u2019av\u00e9rer probl\u00e9matique.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Faites attention aux \u00e9chantillons en dupliqu\u00e9 et aux \u00e9chantillons qui leur sont myst\u00e9rieusement associ\u00e9s.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">V\u00e9rifiez et passez au crible les \u00e9chantillons avec l\u2019algorithme en fonction de l\u2019ascendance g\u00e9n\u00e9tique (nous utilisons une combinaison de <\/span><a href=\"https:\/\/rajanil.github.io\/fastStructure\/\"><span style=\"font-weight: 400;\">fastStructure<\/span><\/a><span style=\"font-weight: 400;\"> et de <\/span><a href=\"https:\/\/github.com\/gabraham\/flashpca\"><span style=\"font-weight: 400;\">flashPCA<\/span><\/a><span style=\"font-weight: 400;\">). Tachez de maximiser la diversit\u00e9 mais, faites attention aux sous-structures de populations et \u00e0 leur incidence sur les r\u00e9sultats des analyses.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Cherchez les PSN d\u00e9lib\u00e9r\u00e9ment manquants, y compris en raison d\u2019absence par cas : contr\u00f4le de statut ou haplotype.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Rien ne vous emp\u00eache d\u2019utiliser des panels de r\u00e9f\u00e9rence \u00e0 imputation multiple sur une m\u00eame population et utilisez le g\u00e9notype obtenu avec la meilleure qualit\u00e9 m\u00e9trique. C\u2019est particuli\u00e8rement utile pour les \u00e9chantillons de populations m\u00e9lang\u00e9es.<\/span><\/li>\n<\/ul>\n<p><b>Conseils pour les analyses d\u2019\u00e9tudes<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">R\u00e9gression &#8211; Les \u00e9tudes d\u2019association pang\u00e9nomique utilisent g\u00e9n\u00e9ralement des mod\u00e8les de r\u00e9gression pour les r\u00e9sultats en continu et la logistique pour les r\u00e9sultats ponctuels. Cela permet de quantifier le risque au niveau du PSN tout en tenant compte des co-variables. <\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Divers paquets de logiciels peuvent \u00eatre utilis\u00e9s pour op\u00e9rer des mod\u00e8les lin\u00e9aires mixtes, lesquels sont fiables pour la pr\u00e9paration et l\u2019\u00e9talonnage pr\u00e9cis des sous-structures de population.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">PC &#8211; Calculer les principaux chargements de composant \u00e0 partir du g\u00e9notypage des donn\u00e9es pang\u00e9nomiques permet d\u2019obtenir un ensemble de co-variables utiles pour vos mod\u00e8les de r\u00e9gression, vous permettant r\u00e9ellement de compter sur une sous-structure de population.<\/span><\/li>\n<\/ul>\n<p><b>Maintenant, passons \u00e0 la m\u00e9ta-analyse<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Fixe ou al\u00e9atoire &#8211; Il s\u2019agit de m\u00e9thodes de m\u00e9ta-analyse qui permettent de combiner des donn\u00e9es au niveau du r\u00e9sum\u00e9 statistique, de fa\u00e7on transversale aux silos et\/ou publications. Les m\u00e9ta-analyses sont souvent utiles pour les analyses de d\u00e9couverte et g\u00e9n\u00e9ralement plus puissantes, bien que certains parmi nous pr\u00e9f\u00e8rent les mod\u00e8les \u00e0 effets randomis\u00e9s, plus conservateurs et qui tiennent compte de l\u2019h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 des silos de donn\u00e9es.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Estimations de l\u2019h\u00e9t\u00e9rog\u00e9n\u00e9it\u00e9 &#8211; Souvent appel\u00e9es test Q de Cochran ou I2, elles sont tr\u00e8s importantes pour avoir une id\u00e9e de l\u2019\u00e9cart des valeurs aberrantes.<\/span><\/li>\n<\/ul>\n<p><b>Examen de contr\u00f4le<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Niveau d\u2019\u00e9tude des lambdas &#8211; les maintenir dans une fourchette de 0,95 \u00e0 1,05 ; toute autre valeur posera probl\u00e8me.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Lambdas g\u00e9n\u00e9raux et lambda 1000 &#8211; Le calcul des lambdas \u00e0 l\u2019\u00e9chelle de l\u2019\u00e9tude ou de la m\u00e9ta-analyse peut \u00eatre d\u00e9licat en cas de d\u00e9s\u00e9quilibre du contr\u00f4le. Un nombre massif de contr\u00f4les peut faire gonfler artificiellement les statistiques lambda. Dans ce cas, utilisez le lambda 1000 car il est \u00e9tabli pour 1000 cas et 1000 contr\u00f4les. Nous vous rappelons que ce code se trouve dans notre recueil GitHub.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Interception du score par d\u00e9s\u00e9quilibre de liaison (DL) &#8211; M\u00e9thode alternative ou compl\u00e9mentaire \u00e0 la m\u00e9thode lambda et plus solide pour la structure et le cas DL : contr\u00f4ler les d\u00e9s\u00e9quilibres.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Le DL atteint son maximum sur des zones affichant une uniformit\u00e9. C\u2019est assez simple car lorsque regroup\u00e9s en zones, vos r\u00e9sultats devraient ressembler aux tours de Manhattan (ou de la ville de votre choix) et pas \u00e0 une temp\u00eate de neige.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">R\u00e9plication &#8211; C\u2019est toujours bien mais parfois, vous n\u2019avez pas les ensembles de donn\u00e9es \u00e0 disposition. Lorsque les donn\u00e9es suppl\u00e9mentaires ne sont pas disponibles, essayez un m\u00e9lange entre le fait de laisser une m\u00e9ta-analyse de c\u00f4t\u00e9 et la validation crois\u00e9e. <\/span><\/li>\n<\/ul>\n<p><b>Quelques analyses post-\u00e9tudes d\u2019association pang\u00e9nomique<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">ou \u00ab que faire une fois que vous avez termin\u00e9 votre analyse de l\u2019\u00e9tude d\u2019association pang\u00e9nomique \u00bb. Notez que le GP2 proposera d\u2019autres blogs et formations sur ce sujet.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Analyses conditionnelles &#8211; Utilisez le PSN le plus pertinent dans une r\u00e9gion donn\u00e9e comme co-variable et relancez les analyses ou utilisez un outil tel que le <\/span><a href=\"https:\/\/cnsgenomics.com\/software\/gcta\/#Overview\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GCTA<\/span><\/a><span style=\"font-weight: 400;\">. Il se peut que vous ayez des signaux ind\u00e9pendants multiples par locus.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Cartographie fine &#8211; Elle peut \u00eatre obtenue par le biais de l\u2019analyse de facteur Bayes en lot tels que <\/span><a href=\"https:\/\/github.com\/chr1swallace\/coloc\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">coloc<\/span><\/a> <span style=\"font-weight: 400;\">incluant la colocalisation bay\u00e9sienne (utilisation des donn\u00e9es de r\u00e9f\u00e9rence g\u00e9nomique pour l\u2019expression g\u00e9nique ou une m\u00e9trique similaire).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Poids de pr\u00e9diction et TWAS &#8211; un ensemble de paquets existent pour exploiter la charge ext\u00e9rieure de l\u2019expression g\u00e9nique, m\u00e9thylation ou \u00e9tudes de chromatine, etc. afin d\u2019identifier les \u00e9ventuels g\u00e8nes reli\u00e9s m\u00e9caniquement se cachant dans vos donn\u00e9es d\u2019\u00e9tude d\u2019association pang\u00e9nomique.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">ML &#8211; con\u00e7u pour les projections, notre paquet favori est <\/span><a href=\"https:\/\/genoml.github.io\/\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GenoML <\/span><\/a><span style=\"font-weight: 400;\">parce qu\u2019il est essentiellement automatis\u00e9 et rend facile l\u2019apprentissage machine (AM) en g\u00e9nomique.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">Pour plus d\u2019informations, vous trouverez notre code et lignes sur le <\/span><a href=\"https:\/\/github.com\/GP2code\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GitHub du GP2<\/span><\/a><span style=\"font-weight: 400;\">.<\/span><\/p>\n<p>Ce blog a \u00e9t\u00e9 co-\u00e9crit par Hampton Leonard, Mike Nalls, Yeajin Song et Dan Vitale. Veuillez consulter la page du GP2 du <a href=\"\/working-groups\/complex-disease-data-analysis-working-group\/\">groupe de travail sur l\u2019analyse des donn\u00e9es &#8211; Maladie complexe<\/a> pour en savoir plus sur les auteurs.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dans le droit fil du dernier blog intitul\u00e9 \u00ab Comprendre les \u00e9tudes d\u2019association pang\u00e9nomique \u00bb, le groupe de travail du GP2 sur l\u2019analyse des donn\u00e9es de maladies complexes propose des conseils pratiques et quelques notions pour vous aider \u00e0 lancer votre propre \u00e9tude d\u2019association pang\u00e9nomique.<\/p>\n","protected":false},"author":0,"featured_media":50019561,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":"","_links_to":"","_links_to_target":""},"class_list":["post-50011858","post","type-post","status-publish","format-standard","hentry","post-type-genetique-des-maladies-complexes"],"acf":[],"_links":{"self":[{"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/posts\/50011858","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/comments?post=50011858"}],"version-history":[{"count":0,"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/posts\/50011858\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/media\/50019561"}],"wp:attachment":[{"href":"https:\/\/gp2.org\/fr\/wp-json\/wp\/v2\/media?parent=50011858"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}