GP2第十次数据发布内容

30 6 月, 2025

Hampton Leonard 、 Mike A. Nalls 、 Dan Vitale 、 Mathew Koretsky 、 Kristin Levine 、 Mary B. Makarious 、 Lietsel Jones 、 Zih-Hua Fang 和 J C. Solle

概述

2025年7月,GP2宣布发布第十次与AMP® PD合作,在Terra和Verily® Workbench 平台上发布的数据。本次发布新增了11,109名基因分型参与者和13,339名全基因组测序(WGS)参与者。

  • 目前,基因型阵列(NBA)数据共包含82,944例基因型参与者(36,939例帕金森病病例、18,249例对照和26,184例 “其它 ”表型)。
    • 去除本地样本后,目前共有65,303 人(28,586例PD、15,258例对照和21,459例 “其它 “表型)。
  • 目前,全基因组测序 (WGS) 数据共包含21,073名测序参与者(8,134例PD病例、3,531例对照和9,408例“其它”表型)。
    • 去掉本地限制样本后,样本现包括16,608名参与者(6,801名PD病例、3,244名对照和6,563名“其它”表型)。
    • 值得注意的是,通过单基因网络招募的病例被编码为“其他”
  • 当前临床外显子组数据包含 10,454 份帕金森病(PD)样本(第 8 版数据)。
  • 在 92,021份拥有遗传数据(神经退行性疾病芯片[NBA]、全基因组测序[WGS]或临床外显子组)的独立样本中,26,982 名个体还包含额外的扩展临床信息。

此次发布有哪些新内容?

基因组数据规模扩展 本次数据版本新增了大量有可用遗传数据的受试者。我们新增了:

  • 新增11,109名携带基因分型阵列(NBA)数据(NBA)的受试者
  • 新增13,339名携带全基因组测序(WGS)数据的受试者
  • 新增12,311名携带扩展临床数据的受试者
  • 一份记录家族内个体间亲缘关系配对估测的家族文件(及对应数据字典)。

该文件既包含推断的亲缘关系(含亲缘系数),也包含上报的亲缘关系。在基因分型阵列数据的填补中重新引入假常染色体(PAR)区域 ,提升了对性染色体变异的覆盖率和解读能力。

  • 这一改进是提升基因组覆盖度和分析准确性的持续努力之一。联合检测现已纳入AMP® PD研究队列。
    • 经联合检测的全基因组测序(WGS)变异数据集,现已纳入以下五大AMP® PD 研究队列样本: BioFind、 PPMI、 LCC、 STEADY-PD3、 SURE-PD3。通过将这些样本与GP2联合处理(而非独立分析),有效降低了数据缺失率和人为误差,同时提高了基因分型准确性。
  • 我们已在主键表中新增一列,用于标注同时存在于GP2和AMP-PD数据集中的样本。

针对rs3115534的跨祖源靶向填补分析 鉴于该内含子变异位点 rs3115534 与帕金森病风险升高及快速眼动(REM)睡眠行为障碍相关 ,并已获功能验证我们应科研界强烈需求,现采用靶向填补策略确保其纳入发布数据集。

  • 确切地说,我们采用千人基因组计划第三阶段30x高深度参考面板,对1号染色体在五个祖源群体(非洲裔[AFR]、非裔加勒比人[AAC]、美洲混血[AMR]、中东[MDE]、中亚高加索[CAH])进行了靶向填补分析。
  • 完成填补分析后,rs3115534位点数据已整合回基于TOPMed的GP2发布版本填补文件中。

    需注意,该变异位点(rs3115534)在其他祖源群体中的填补质量指标未达到阈值标准(R² < 0.3)。

rs3115534位点第10版填补质量指标(基于千人基因组计划第三阶段30x参考面板)
人口 状态 AF MAF AVG_CS R2
AFR 填补 0.761049 0.238951 0.992879 0.968831
AAC 填补 0.855586 0.144414 0.993458 0.959606
AMR 填补 0.983414 0.0165855 0.991453 0.507857
MDE 填补 0.980407 0.0195926 0.990912 0.584081
CAH 填补 0.93793 0.0620703 0.993982 0.909959

全新汇总统计数据上线
我们最新发布了多项全基因组关联分析(GWAS)汇总统计数据集,显著提升了全球人群代表性:

  • GP2欧洲人群(EUR)meta-GWAS研究数据(预印本|; GitHub)
  • 南非人群GWAS分析数据
    (预印本准备中 ;
    GitHub)

  • 印度GWAS (预印本; GitHub)
  • 快速眼动睡眠行为障碍(RBD)GWAS分析数据(预印本准备中 ; GitHub准备中)

拉丁美洲帕金森病遗传学研究联盟(LARGE-PD)GWAS分析数据(预印本准备中 ; GitHub准备中)

临床数据 此次发布总共包含92,021个人的临床数据,这些个人带有遗传和核心临床数据。其中,26,982份样本具有深度临床表型数据。
这些信息包括:

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知检查,如小型精神状态检查 (MMSE) 和蒙特利尔认知评估 (MoCA)
  • 运动障碍协会赞助的统一帕金森病评分量表修订版(MDS-UPDRS)
  • 详细的“其他”表型,例如路易体痴呆 (LBD)

个体级别的数据
我们现在总共采集了104个队列的数据。有关已共享队列的更多信息,请参阅
GP2队列看板。  阵列基因分型GP2参与者的遗传血统分为11个血统组;以下表格详细列出了本次发布中通过阵列数据和全基因组测序(WGS)质量控制的受试者,其经遗传学鉴定的祖源信息。这些数字反映了以前发布的样本,使用更新的聚类文件重新聚类并进行质量控制,以及本次发布版本独有的新基因分型样本。最终数据表提供了经遗传学鉴定的其他非帕金森病表型样本的血统信息。

GP2第10版阵列分型数据发布
血统 总计( +VWB ) PD (+VWB) 控制 (+VWB) 其它 (+VWB)
非洲人 3,754 (3,780) 1,181 (1191) 2,305 (2,307) 268 (282)
非洲混血 1,192 (1,215) 361 (370) 760 (763) 71 (82)
阿什肯纳兹犹太人 3,265 (3,472) 1,482 (1,531) 408 (435) 1,375 (1,506)
美洲的拉丁裔和原住民 3,564 (3,608) 1,974 (1,995) 1,433 (1,439) 157 (174)
东亚人 6,619 (6,662) 2,393 (2,411) 2,697 (2,705) 1,529 (1,546)
欧洲人 41,901 (58,823) 18,703 (26,778) 5,899 (10,372) 17,299 (21,673)
南亚人 801 (945) 270 (317) 260 (269) 271 (359)
中亚人 1670 (1691) 776 (782) 624 (626) 270 (283)
中东人 1349 (1,493) 675 (752) 535 (559) 139 (182)
芬兰人 116 (144) 87 (106) 8 (12) 21 (26)
混合祖源 1,072 (1,111) 684 (706) 329 (334) 59 (71)
总计 65,303 (82,944) 28,586 (36,939) 15,258 (19,821) 21,459 (26,184)

 

全基因组测序数据 – GP2第10版发布
血统 总计( +VWB ) PD (+VWB) 控制 (+VWB) 其它 (+VWB)
非洲人 1,671 (1,696) 646 (656) 848 (853) 177 (187)
非洲混血 254 (267) 126 (130) 113 (114) 15 (23)
阿什肯纳兹犹太人 1,389 (1,485) 337 (355) 100 (106) 952 (1,024)
美洲的拉丁裔和原住民 301 (333) 154 (171) 24 (24) 123 (138)
东亚人 2,525 (2,542) 576 (582) 343 (343) 1,606 (1,617)
欧洲人 8,354 (12,461) 4,155 (5,389) 1,131 (1,397) 3,068 (5,675)
南亚人 309 (417) 47 (73) 10 (16) 252 (328)
中亚人 833 (840) 259 (261) 329 (330) 245 (249)
中东人 788 (824) 386 (394) 308 (309) 94 (121)
芬兰人 22 (30) 17 (20) 4 (4) 1(6)
混合祖源 162 (178) 98 (103) 34 (35) 30 (40)
总计 16,608 (21,073) 6,801 (8,134) 3,244 (3,531) 6,563 (9,408)

 

“其它”表型数据 – GP2第10版发布(基于VWB群体)
血统 前驱期 NBA/WGS PSP NBA/ WGS AD NBA/WGS DLB NBA/ WGS MSA NBA/ WGS CBD/CBS NBA/WGS FTD NBA/WGS
非洲人 16/7 6/4 0/0 2/0 7/4 1/0 0/0
非洲混血 23/7 4/2 1/0 0/0 2/0 1/0 0/0
阿什肯纳兹犹太人 308/71 23/12 9/0 14/6 8/3 4/3 2/1
美洲的拉丁裔和原住民 30/11 5/0 5/0 2/0 2/0 1/0 0/0
东亚人 27/4 14/63 4/4 18/0 6/178 2/32 0/0
欧洲人 4206/848 1307/ 920 484/136 442/340 421/ 334 166/159 65/63
南亚人 3/2 34/32 1/0 5/1 5/8 9/9 2/2
中亚人 4/4 4/1 70/72 4/1 1/0 4/1 0/0
中东人 14/1 9/4 2/2 1/0 0/0 1/1 1/1
芬兰人 9/0 2/1 2/0 0/0 1/1 0/0 1/0
混合祖源 9/2 7/5 5/4 3/1 1/0 0/0 1/1
总计 4649/957 1415/ 1044 583/218 491/349 454/ 528 189/205 72/68

 

临床数据概览 – GP2第10版发布(基于VWB群体)
临床数据 样本量(N)与唯一标识符 随访样本量(N)及追踪ID
样本采集时年龄 71,747
发病年龄 38,718
确诊年龄 31,667
基本家族史 92,021
人口统计学 26,701
Hoehn & Yahr分期 11,486 5,515
UPDRS第1部分评分 2,359 1,057
UPDRS第2部分评分 2,338 1,049
UPDRS第3部分评分 3,606 1,084
UPDRS第4部分评分 1,739 1,090
MDS UPDRS第1部分评分 5,168 2,802
MDS UPDRS第2部分评分 5,242 2,854
MDS UPDRS第3部分评分 7,532 2,870
MDS UPDRS第4部分评分 2,479 1,016
MOCA 9,500 2,753
MMSE 1,954
RBD评分 3,986 3,290
头部创伤史 5,495 3,747
生命体征 5,895 4,035
嗅觉功能 5,200 1,466

数据访问

通过Verily Viewpoint Workbench访问受本地限制的GDPR样本
我们正在通过与Verily Viewpoint Workbench合作,继续试行授予对本地限制样本(也称为受通用数据保护条例 (GDPR) 政策管辖的样本)的访问权限。
目前,随着GP2继续为受GDPR保护的数据实施数据共享解决方案,受地区限制的第十次发布的数据将仅提供给GP2联盟成员和合作伙伴。随着2025年测试和实施的继续,该解决方案将可供更广泛的研究界使用。第十次发布的所有样本都可以在Workbench上找到,而不受GDPR限制的所有第十次发布样本都可以在Terra上的社区工作台上找到(与之前的所有发布的数据一样)。要访问VWB上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写GDPR规定的样本申请表
  3. 成为GP2联盟成员(贡献队列、GP2合作伙伴或项目分析团队成员)

未来的数据发布还将继续提高参与者的多样性。您可访问我们的数据看板,实时追踪项目进展。

对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子对此进行了详细介绍。  与往常一样,请参阅每个GP2发布版本附带的自述文件,以获取有关质量控制、管道、数据和分析的建议的更多详细信息!

见见作者

协作研究网络负责人

Hampton Leonard

National Institute on Aging/National Institutes of Health | 美国

顾问

Mike A. Nalls,PhD

National Institutes of Health | 美国

数据科学家

Dan Vitale

National Institutes of Health | 美国

数据和软件工程师

Mathew Koretsky,BSc

National Institutes of Health | WA

数据科学家

Kristin Levine,MSc

Data Tecnica International | 美国

生物医学数据科学家,合同工

Mary B. Makarious,PhD

National Institutes of Health | 华盛顿特区

临床数据分析师

Lietsel Jones,MSc

Data Tecnica International | 贝塞斯达

研究员

Zih-Hua Fang,PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | 美国