GP2第八次数据发布内容

18 9 月, 2024

Hampton Leonard 、 Mike A. Nalls 、 Dan Vitale 、 Mathew Koretsky 、 Kristin Levine 、 Mary B Makarious 、 利特塞尔·琼斯(Lietsel Jones) 、 Zih-Hua Fang 和 J C. Solle

概述

2024年9月,GP2 宣布与 AMP® PD 合作,在 Terra 和 Verily® Workbench 平台上发布第八次数据。此次发布包括5,481个额外的全基因组序列和10,454个临床外显子组序列。后续版本中将提供额外的基因分型信息。

  • 目前,全基因组测序 (WGS) 数据共包含7,734名测序参与者(6,113例PD病例、617例对照和1,004例“其他”表型)。
    • 去掉本地限制样本后,样本现包括4,713名参与者(4,098名PD病例、390名对照和225名“其他”表型)。
    • 值得注意的是,通过单基因网络招募的病例被编码为“其他”。
  • 此外,此次WGS发布中还包含两个AMP ® PD队列(BioFind 和 PPMI)的部分全基因组序列发布,这些序列已与GP2 WGS联合调用。已发布的样本可以通过发布版本中附带的ID交叉对照文件链接回原始AMP® PD ID。
  • 此次发布还包括来自帕金森基金会的10,454名联合临床外显子组测序参与者。
  • 此次发布共包含62,087名拥有核心临床数据的个人。其中,16,800人拥有深入的临床表型和遗传数据。

此次发布有哪些新内容?

  • 额外的GP2全基因组测序样本和联合调用的变体集,包括来自两个AMP ®PD队列(BioFind 和 PPMI)的样本
  • 帕金森基金会的临床外显子组数据
  • 个人临床数据增多,使我们拥有核心临床数据的个人总数达到62,087人 

通过 Verily Viewpoint Workbench引入本地受限的 GDPR 样本

通过与 Verily Viewpoint Workbench 的合作,我们正在继续试行允许访问本地受限样本,即受《一般数据保护条例》(GDPR)政策管辖的样本。目前,随着GP2继续为受GDPR保护的数据实施数据共享解决方案,受地区限制的第八次发布的数据将仅提供给GP2联盟成员和合作伙伴。随着2024年测试和实施的继续,该解决方案将可供更广泛的研究界使用。所有第八次发布的样本均可在Workbench上找到。而不受GDPR限制的所有第八次发布样本都可以在Terra上的社区工作台上找到(与之前的所有发布的数据一样)。要访问VWB上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写GDPR规定的样本申请表
  3. 是GP2联盟成员(贡献队列、GP2合作伙伴或项目分析小组成员)

临床数据

此版本包含总共62,087名个人的临床数据,这些个人拥有遗传和核心临床数据。此次发布的内容包含16,800名个体的深度临床表型数据和基因数据。这些信息包括:

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知测试,例如简易精神状态检查和蒙特利尔认知评估
  • 运动障碍协会赞助的统一帕金森病评定量表修订版
  • 详细的“其他”表型,如路易体痴呆症
  • 通过单基因网络招募的病例被编码为“其他”

临床外显子组序列

帕金森基金会提供的临床外显子组测序可用于本次发布的10,454个帕金森基金会样本,提供4,717个基因的编码区和剪接点的分析。这些针对性的测序旨在识别和报告具有潜在临床意义的变异,重点关注那些与患者临床信息和家族史相符的变异。欲了解更详细信息,请访问 Fulgent Genetics临床外显子组页面。

DeepVariant-GLnexus 的全基因组序列

我们使用Google的DeepVariant流程GLnexus进行群组级变体调用。DeepVariant是一款基于深度学习的变体调用器,通过准确的在个体级别上检测出基因变异,其性能优于现有的最先进工具。它还简化了过程,提高了准确性和可靠性。  阵列基因分型的 GP2 参与者的按照基因分为 11 个血统组;下表详细列出了本次发布的基因分型参与者中通过质量控制和估算的遗传血统。这些数字包括以前版本的样本,这些样本已经使用新的集群文件重新聚集,并通过了质量控制,同时还包括本次发布的新基因型和共享样本。 未来的数据发布还将继续提高参与者的多元性。您可在队列看板上查看我们的进展。对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子中对此进行了详细介绍。


与往常一样,请参阅每个GP2版本附带的自述文件,以获取有关质量控制、管道、数据和分析的建议的更多详细信息!

见见作者

Lead of Collaborative Research

Hampton Leonard

National Institute on Aging/National Institutes of Health | USA

Consultant

Mike A. Nalls,PhD

National Institutes of Health | USA

Data Scientist

Dan Vitale

National Institutes of Health | USA

Postbac IRTA Fellow

Mathew Koretsky,BSc

National Institutes of Health | USA

Data Scientist

Kristin Levine,MSc

Data Tecnica International | USA

Pre-doctoral Intramural Research Training Awardee

Mary B Makarious,BSc

National Institutes of Health | USA

利特塞尔·琼斯(Lietsel Jones)

DataTecnica/National Institutes of Health | 美国

Scientist

Zih-Hua Fang,PhD

The German Center for Neurodegenerative Diseases | Germany

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | USA