{"id":50011866,"date":"2021-05-24T20:26:04","date_gmt":"2021-05-25T00:26:04","guid":{"rendered":"https:\/\/gp2stg.wpenginepowered.com\/en-que-consisten-los-gwas-parte-2-ideas-y-consejos\/"},"modified":"2024-10-21T15:06:18","modified_gmt":"2024-10-21T19:06:18","slug":"en-que-consisten-los-gwas-parte-2-ideas-y-consejos","status":"publish","type":"post","link":"https:\/\/gp2.org\/es\/en-que-consisten-los-gwas-parte-2-ideas-y-consejos\/","title":{"rendered":"En qu\u00e9 consisten los GWAS, parte 2: Ideas y consejos"},"content":{"rendered":"<p><span style=\"font-weight: 400;\">En nuestro \u00faltimo <\/span><a href=\"https:\/\/gp2.org\/understanding-gwas\/\"><span style=\"font-weight: 400;\">art\u00edculo de blog<\/span><\/a><span style=\"font-weight: 400;\">, presentamos una introducci\u00f3n a los GWAS con f\u00f3rmulas estad\u00edsticas, flujos de trabajo y ejemplos de los GWAS m\u00e1s recientes sobre la enfermedad de Parkinson. Ahora queremos sugerirle algunas ideas y consejos para que lleve a cabo su propio GWAS.<\/span><\/p>\n<p><b>Control de calidad y procesos de imputaci\u00f3n\u00a0<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Genotipos de alta calidad (no palindr\u00f3micos, es decir, sin A\/T, G\/C, a ser posible, y con una alta puntuaci\u00f3n GenTrain de Illumina, indicadora de la calidad del cl\u00faster) con una baja tasa de ausencias (preferentemente &lt; 1% por muestra y por SNP).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Por lo general, c\u00e9ntrese en frecuencias menores y comunes del alelo &gt; 1%, y cruce los dedos para que los grupos de genotipos tengan buen aspecto (deber\u00e1 inspeccionarlos).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Compruebe si las muestras presentan altos \u00edndices de heterocigosidad, que es un posible signo de contaminaci\u00f3n. Una tasa baja de heterocigosidad tambi\u00e9n podr\u00eda ser problem\u00e1tica.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Cuidado con las muestras duplicadas y las muestras cr\u00edpticamente relacionadas.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Determine y analice algor\u00edtmicamente las muestras por ascendencia gen\u00e9tica (nosotros utilizamos una combinaci\u00f3n de <\/span><a href=\"https:\/\/rajanil.github.io\/fastStructure\/\"><span style=\"font-weight: 400;\">fastStructure<\/span><\/a><span style=\"font-weight: 400;\"> y <\/span><a href=\"https:\/\/github.com\/gabraham\/flashpca\"><span style=\"font-weight: 400;\"> flashPCA<\/span><\/a><span style=\"font-weight: 400;\">). Es importante maximizar la diversidad, pero hay que tener cuidado con la subestructura de la poblaci\u00f3n y sus efectos en los resultados de los an\u00e1lisis.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">F\u00edjese en casos en los que la ausencia de SNP no sea una casualidad, por ejemplo en casos de sesgo en que dicha ausencia sea fruto de un estado de control de caso o en haplotipos.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Puede aplicar m\u00faltiples paneles de referencia de imputaci\u00f3n para una \u00fanica poblaci\u00f3n y luego usar el genotipo resultante con la m\u00e9trica de mejor calidad. Esto es especialmente \u00fatil en poblaciones de muestras mezcladas.<\/span><\/li>\n<\/ul>\n<p><b>Consejos sobre los an\u00e1lisis a nivel de estudio<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Regresi\u00f3n. Los GWAS suelen utilizar modelos de regresi\u00f3n lineal para los resultados continuos y de regresi\u00f3n log\u00edstica para los resultados discretos. Estos cuantifican el riesgo en un SNP al tiempo que consideran las covariables.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Se pueden utilizar distintos paquetes de software para ejecutar modelos lineales mixtos. Estos modelos dan cuenta de las relaciones con precisi\u00f3n y procesan a escala fina la subestructura de la poblaci\u00f3n.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">PC. El c\u00e1lculo de las cargas de los componentes principales a partir de los datos de genotipado de todo el genoma brinda un conjunto de covariables que resultar\u00e1 \u00fatil para sus modelos de regresi\u00f3n, que a efectos pr\u00e1cticos le permitir\u00e1 dar cuenta de la subestructura de la poblaci\u00f3n.<\/span><\/li>\n<\/ul>\n<p><b>Ahora fij\u00e9monos en el metan\u00e1lisis<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Fijo vs aleatorio. Son dos m\u00e9todos de metan\u00e1lisis que permiten combinar datos para elaborar s\u00edntesis estad\u00edsticas a partir de silos de datos o publicaciones. Los metan\u00e1lisis de efecto fijo suelen ser \u00fatiles para los an\u00e1lisis de descubrimiento y, en general, son m\u00e1s potentes, aunque algunos preferimos los modelos de efecto aleatorio, ya que brindan an\u00e1lisis m\u00e1s conservadores y tienen en cuenta la heterogeneidad entre los silos de datos.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Estimaciones de la heterogeneidad. A menudo expresada como Q de Cochrane o I2. Son fundamentales porque dan una idea tanto del sesgo por efecto de los valores at\u00edpicos como del potencial generalizable de los resultados.<\/span><\/li>\n<\/ul>\n<p><b>Resultados del escrutinio<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Lambdas a nivel del estudio. Deben mantenerse entre 0.95 y 1.05, cualquier otro valor supondr\u00eda un problema.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Lambda total y lambda 1000. El c\u00e1lculo de lambdas tanto a nivel de estudio como de metan\u00e1lisis puede ser complicado cuando existen desequilibrios entre casos y controles. Un gran exceso de controles puede inflar artificialmente la estad\u00edstica lambda. En este caso, utilice lambda1000, a la que se aplica una escala de 1000 casos y 1000 controles. Una vez m\u00e1s, encontrar\u00e1 el c\u00f3digo correspondiente en nuestro repositorio de GitHub.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Intercepci\u00f3n de la puntuaci\u00f3n de desequilibrio del ligamiento (LD). Alternativa \/ complemento a lambda y m\u00e1s robusto que la estructura de LD y caso: desequilibrio de control.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">El LD alcanza los valores m\u00e1s altos en segmentos que presentan uniformidad. Esto es bastante sencillo: al representar sus resultados, los segmentos deben parecer los rascacielos de Manhattan (o de la ciudad que prefiera, lo siento D.C.), y no una tormenta de nieve.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Replicaci\u00f3n. Siempre es buena, pero a veces no hay conjuntos de datos disponibles. Cuando no se disponga de datos adicionales, intente una combinaci\u00f3n de metan\u00e1lisis con exclusi\u00f3n y validaci\u00f3n cruzada.<\/span><\/li>\n<\/ul>\n<p><b>Algunos an\u00e1lisis post-GWAS<\/b><b> <\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">O \u00abqu\u00e9 hacer una vez completados sus metan\u00e1lisis GWAS\u00bb. Tenga en cuenta que el GP2 publicar\u00e1 m\u00e1s art\u00edculos de blog y cursos sobre estos temas.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">An\u00e1lisis condicionales. Use el SNP m\u00e1s significativo en una regi\u00f3n como covariable y vuelva a ejecutar los an\u00e1lisis o use una herramienta como <\/span><a href=\"https:\/\/cnsgenomics.com\/software\/gcta\/#Overview\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">GCTA<\/span><\/a><span style=\"font-weight: 400;\">. Puede obtener varias se\u00f1ales independientes por locus.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Mapeo fino. Se puede hacer mediante el an\u00e1lisis factorial bayesiano aproximado en paquetes como <\/span><a href=\"https:\/\/github.com\/chr1swallace\/coloc\" target=\"_blank\" rel=\"noopener\"><span style=\"font-weight: 400;\">coloc<\/span><\/a><span style=\"font-weight: 400;\">, incluyendo la colocalizaci\u00f3n bayesiana (aprovechando datos gen\u00f3micos de referencia para la expresi\u00f3n de genes o par\u00e1metros similares).<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">Peso de predicciones y TWAS. Existen diversos paquetes para aprovechar el peso externo de los estudios de expresi\u00f3n g\u00e9nica, metilaci\u00f3n o cromatina, etc. para identificar los genes putativos conectados mec\u00e1nicamente que se esconden en sus datos GWAS.<\/span><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><span style=\"font-weight: 400;\">En cuanto a predicciones creadas a prop\u00f3sito basadas en aprendizaje autom\u00e1tico (AA), nuestro paquete favorito es <\/span><a href=\"https:\/\/genoml.github.io\/\" target=\"_blank\" rel=\"noopener\"> <span style=\"font-weight: 400;\">GenoML<\/span><\/a><span style=\"font-weight: 400;\">, porque est\u00e1 b\u00e1sicamente automatizado y facilita el AA en el campo de la gen\u00f3mica.<\/span><\/li>\n<\/ul>\n<p><span style=\"font-weight: 400;\">Para m\u00e1s informaci\u00f3n, encontrar\u00e1 nuestro c\u00f3digo y pipelines en el <\/span><a href=\"https:\/\/github.com\/GP2code\" target=\"_blank\" rel=\"noopener\"> <span style=\"font-weight: 400;\">GitHub del GP2<\/span><\/a><span style=\"font-weight: 400;\">.<\/span><\/p>\n<p>Este blog es obra conjunta de Hampton Leonard, Mike Nalls, Yeajin Song y Dan Vitale. Visite la p\u00e1gina del <a href=\"\/working-groups\/complex-disease-data-analysis-working-group\/\">Grupo de Trabajo de An\u00e1lisis de Datos sobre Enfermedad de Parkinson de Etiolog\u00eda Compleja<\/a> del GP2 para obtener m\u00e1s informaci\u00f3n.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Despu\u00e9s del \u00faltimo art\u00edculo de blog sobre en qu\u00e9 consisten los GWAS, el Grupo de Trabajo de An\u00e1lisis de Datos sobre Enfermedad de Parkinson de Etiolog\u00eda Compleja del GP2 proporciona consejos pr\u00e1cticos e ideas para realizar su propio GWAS.<\/p>\n","protected":false},"author":0,"featured_media":50019564,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":"","_links_to":"","_links_to_target":""},"class_list":["post-50011866","post","type-post","status-publish","format-standard","hentry","post-type-enfermedad-de-parkinson-de-etiologia-compleja"],"acf":[],"_links":{"self":[{"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/posts\/50011866","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/types\/post"}],"replies":[{"embeddable":true,"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/comments?post=50011866"}],"version-history":[{"count":0,"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/posts\/50011866\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/media\/50019564"}],"wp:attachment":[{"href":"https:\/\/gp2.org\/es\/wp-json\/wp\/v2\/media?parent=50011866"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}