GP2第十一次数据发布内容

1 12 月, 2025

Hampton Leonard 、 Mike A. Nalls 、 Dan Vitale 、 Mathew Koretsky 、 Kristin Levine 、 Mary B. Makarious 、 Lietsel Jones 、 Zih-Hua Fang 和 J C. Solle

概述

2024年12月,GP2 宣布发布第十一次与AMP® PD合作,在Terra和 Verily® Workbench 平台上发布的数据。本次发布新增了20,842名基因分型受试者和17,153名全基因组测序(WGS)受试者,以及4,232 份临床外显子组数据。

  • 基因型芯片(NBA)数据(包括受当地限制的样本)目前共包含 103,786 名完成基因分型的参与者,(46,327 例帕金森病(PD)病例、28,857 名对照个体,以及 28,602 名具有“其他”表型的受试者)。
  • 目前,全基因组测序 (WGS) 数据共包含38,226名测序参与者(18,219例PD病例、9,172例对照和10,835例“其它”表型)。
  • 当前临床外显子组数据包含 14,686 份帕金森病(PD)样本
  • 在 122,317份拥有遗传数据(神经退行性疾病芯片[NBA]、全基因组测序[WGS]或临床外显子组)的独立样本中,32,897 名个体还包含额外的扩展临床信息。

此次发布有哪些新内容?

基因组数据规模扩展 本次数据版本新增了大量有可用遗传数据的受试者。我们新增了:

  • 新增20,842名携带基因分型阵列(NBA)数据(NBA)的受试者
  • 新增17,153名携带全基因组测序(WGS)数据的受试者
  • 新增5915名携带扩展临床数据的受试者
  • 一份记录家族内个体间亲缘关系配对估测的家族文件(及对应数据字典)。该数据同时包含推断的亲缘关系(含亲缘系数)及上报的亲缘关系。

联合变异检测现包含 AMP® PD 队列

  • 联合检测的 WGS 变异数据现已纳入 AMP® PD 项目中的七个队列:BioFIND, HBS, PDBP, PPMI, LCC, STEADY-PD3 and SURE-PD3. 
    • 通过将这些样本与GP2联合处理(而非独立分析),有效降低了数据缺失率和人为误差,同时提高了基因分型准确性。
  • 我们已在主键表中新增一列,用于标注同时存在于GP2和AMP-PD数据集中的样本。

新的汇总统计数据现已发布 我们已经在一级(Tier 1)权限下新增并开放了多项 GWAS 汇总统计数据集,包括:

临床数据 此次发布总共包含122,317个人的临床数据,这些个人带有遗传和核心临床数据。其中,32,897份样本具有深度临床表型数据。这些信息包括:

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知检查,如小型精神状态检查 (MMSE) 和蒙特利尔认知评估 (MoCA)
  • 运动障碍协会赞助的统一帕金森病评分量表修订版(MDS-UPDRS)
  • 详细的“其他”表型,例如路易体痴呆 (LBD)

个体级别的数据
我们现在总共采集了148个队列的数据。有关已共享队列的更多信息,请参阅
GP2队列看板。  阵列基因分型GP2参与者的遗传血统分为11个血统组;下表详细列出了此版本中已通过质量控制和推断的基因分型参与者的遗传血统。这些数字反映了以前发布的样本,使用更新的聚类文件重新聚类并进行质量控制,以及本次发布版本独有的新基因分型样本。最终数据表提供了经遗传学鉴定的其它非帕金森病表型样本的血统信息。 表1 表 2 表 3 表 4

数据访问

通过Verily Viewpoint Workbench 访问受本地限制的GDPR样本
我们正在通过与Verily Viewpoint Workbench合作,继续试行授予对本地限制样本(也称为受通用数据保护条例 (GDPR) 政策管辖的样本)的访问权限。要访问VWB上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写GDPR规定的样本申请表

未来的数据发布还将继续提高参与者的多样性。您可访问我们的数据看板,实时追踪项目进展。对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子对此进行了详细介绍。  与往常一样,请参阅每个GP2发布版本附带的自述文件,以获取有关质量控制、管道、数据和分析的建议的更多详细信息!

见见作者

协作研究网络负责人

Hampton Leonard

National Institute on Aging/National Institutes of Health | 美国

顾问

Mike A. Nalls,PhD

National Institutes of Health | 美国

数据科学家

Dan Vitale

National Institutes of Health | 美国

数据和软件工程师

Mathew Koretsky,BSc

National Institutes of Health | WA

数据科学家

Kristin Levine,MSc

Data Tecnica International | 美国

生物医学数据科学家,合同工

Mary B. Makarious,PhD

National Institutes of Health | 华盛顿特区

临床数据分析师

Lietsel Jones,MSc

Data Tecnica International | 贝塞斯达

研究员

Zih-Hua Fang,PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | 美国