聚焦:介绍新的 GP2 队列浏览器应用
返回到博客

聚焦:介绍新的 GP2 队列浏览器应用

由 复杂疾病-数据分析工作组 | |
Author(s)
  • 复杂疾病-数据分析工作组

    |

    本篇博文由GP2复杂疾病数据分析工作组成员撰写:Hampton Leonard, Mike Nalls, Yeajin Song, Dan Vitale.

GP2 的目的是极大地扩展我们对帕金森病遗传基础的了解,并使这些知识在全球都具有普适性。我们要实现这一目标,就必须建立一个全球研究社区,为解决新的研究需求和问题提供工具和基础设施。在此,我们宣布推出全新应用程——GP2 队列浏览器。这一革命性的工具打造出一个沉浸式的互动平台,使 GP2 队列的贡献者和研究人员能够以高效和用户友好的方式深入研究丰富的基因组数据。GP2 队列浏览器的开发是为了确保那些使用我们的GP2个体遗传学数据的人能够获得流畅、全面的数据探索体验。要访问这些数据集并使用我们的工具,必须签署已获批准的第 2 级 GP2 数据协议,您可以从这里开始申请: https://amp-pd.org/register-for-amp-pd 。您还可以点击此处了解更多有关如何申请的信息。 

以下是新工具的概述,一旦您签署了我们的数据使用协议,就可以立即开始使用! 

您可在此处找到该浏览器: https://gp2-cohort-browser-dot-gp2-release-terra.uc.r.appspot.com/

登陆页面

登陆页面是您了解网络应用程序所有功能的第一步。为您之后的探索奠定基础,从质量控制措施到祖先分类,您都可以在登陆页面先睹为快。

全面的元数据细分

有了这个应用程序,研究人员就可以访问完整的元数据细目,包括直方图。您可以从中详细了解队列的人口统计学特征,如年龄、性别和表型。用户可以选择要检查的队列。

质量控制

GP2 队列浏览器的主要特点之一是严格注重质量控制 (QC)。通过该应用,您可以访问并了解我们的质量控制流程,包括样本和变体级过滤。此外,您还可以在下拉菜单中获得最新的质量控制说明的详细信息。漏斗图将质量控制过程一步步可视化,让您更好地了解数据。

祖先分析

GP2 队列浏览器带有动态三维主成分分析 (PCA) 图,可以交互式地探索遗传祖先。该图谱包括参考面板,可让您按预测祖先提取子集。在图中,您将看到预测祖先的表格和饼图对比,以便更好地了解分布情况。该应用程序还提供混淆矩阵、准确率和 F1 分数等模型性能指标。 下一个版本(预计于 2023 年初秋发布)中值得期待的更新是参考面板的混血人群的扩大,重点关注混血人群,如美洲印第安人/拉丁美洲人 (AMR)、中东人 (MDE) 和中亚人 (CAS)。

SNP 指标

研究人员一旦选择了一个祖先,就有机会探索最新发布的单核苷酸多态性(SNP)指标。用户可以通过 rsID 或位置(在 hg38 中)搜索聚类图。该功能还提供了对照组和疾病组的 GenTrain 分数和小等位基因频率分布。

在未来的版本中,我们将使用自定义的机器学习方法,对低分辨率变体的预测集群进行扩展。

罕见变体

GP2 队列浏览器还有一个专门用于探索罕见变异的部分。它包括 GP2 的单基因网络提供的信息,在该网络中,可以对已知的 PD 基因提取子集,以便进行更深入的研究。侧边栏的过滤器允许用户搜索特定基因,而表格则提供了所有其他方面的综合数据。

结语

我们衷心希望 GP2 队列浏览器能成为您更好地了解 GP2 数据以及为论文和海报制作摘要图表的好工具。

GP2 组群浏览器在不同版本和队列之间保持一致,这是一次大胆的尝试,提高了 GP2 质量控制流程每个步骤的透明度和可访问性。我们要感谢全球所有为 GP2 工作捐献数据的队列,没有他们我们的工作不可能取得今日的成绩。

如有任何疑问或支持,请联系数据分析工作组 [email protected]