GP2第九次数据发布内容

20 12 月, 2024

Hampton Leonard 、 Mike A. Nalls 、 Dan Vitale 、 Mathew Koretsky 、 Kristin Levine 、 Mary B. Makarious 、 Lietsel Jones 、 Zih-Hua Fang 和 J C. Solle

概述

2024年12月,GP2宣布发布第九次与AMP® PD合作,在Terra 和Verily® Workbench 平台上发布的数据。此次发布的数据中又增加了17,690名基因分型参与者。

  • 目前,基因型阵列数据(包括本地受限样本)共包含 71,835 例基因型参与者(31,985例帕金森病病例、18,249例对照和21,601例 “其它 ”表型)。
    • 去除本地样本后,目前共有55,305人(23,709例PD、13,404例对照和18,192例 “其它 “表型)。
  • 在具有基因分型数据的71,835个样本中:
    • 16,800人还拥有深入的临床表型信息(第8版)
    • 16,800人还拥有深入的临床表型信息(第8版)
    • 共有10,454人拥有临床外显子组信息(第8版)

此次发布有哪些新内容?

  • 关于新增数据:
    • 我们已将17,690名基因分型参与者添加到第9版中。
      • 对于希望翻转和对齐原始数据的研究人员,除了 raw_genotypes之外,我们还提供 raw_genotypes_flipped。
    • 关于样本标识符:
      • 用于表示最初通过单基因网络招募的队列的“m-”前缀已被弃用
      • GP2 样本命名的‘_s*’后缀正在弃用。样本编号仍然可以通过主密钥获得,以便与以前的版本ID进行匹配,但基因文件中的GP2样本ID将不再包含“_s*”后缀。
      • 所有文件中的PPMI GP2ID均已更新,包含其PATNO ID,以便研究人员更轻松地跨平台工作。

通过Verily Viewpoint Workbench访问受本地限制的GDPR样本
我们正在通过与Verily Viewpoint Workbench合作,继续试行授予对本地限制样本(也称为受通用数据保护条例 (GDPR) 政策管辖的样本)的访问权限。
目前,随着GP2继续为受GDPR保护的数据实施数据共享解决方案,受地区限制的第九次发布的数据将仅提供给GP2联盟成员和合作伙伴。随着2024年测试和实施的继续,该解决方案将可供更广泛的研究界使用。第九次发布的所有样本都可以在Workbench上找到,而不受GDPR限制的所有第九次发布样本都可以在Terra上的社区工作台上找到(与之前的所有发布的数据一样)。要访问VWB上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写GDPR规定的样本申请表
  3. 是GP2联盟成员(贡献队列、GP2合作伙伴或项目分析小组成员)

此版本包含总共71,835名个人的临床数据,这些个人拥有遗传和核心临床数据。此次发布的内容包含16,800名个体的深度临床表型数据和基因数据。这些信息包括:

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知检查,如小型精神状态检查 (MMSE) 和蒙特利尔认知评估 (MoCA)
  • 运动障碍协会赞助的统一帕金森病评分量表修订版(MDS-UPDRS)
  • 详细的 “其他 “表型,如路易体痴呆 (LBD)
  • 通过单基因网络招募的病例被编码为“其他”

个体级别的数据
我们现在总共采集了 104 个队列的数据。有关已共享队列的更多信息,请参阅 GP2 队列看板。阵列基因分型 GP2 参与者的遗传血统分为 11 个血统组;下表详细列出了此版本中已通过质量控制和推断的基因分型参与者的遗传血统。这些数字反映了以前发布的样本,使用更新的聚类文件重新聚类并进行质量控制,以及此版本独有的新基因分型样本。未来的数据发布还将继续提高参与者的多元性。可在看板上查看我们的进展。对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子中对此进行了详细介绍。与往常一样,请参阅每个GP2版本附带的自述文件,以获取有关质量控制、管道、数据和分析的建议的更多详细信息!

见见作者

协作研究网络负责人

Hampton Leonard

National Institute on Aging/National Institutes of Health | 美国

顾问

Mike A. Nalls,PhD

National Institutes of Health | 美国

数据科学家

Dan Vitale

National Institutes of Health | 美国

数据和软件工程师

Mathew Koretsky,BSc

National Institutes of Health | WA

数据科学家

Kristin Levine,MSc

Data Tecnica International | 美国

生物医学数据科学家,合同工

Mary B. Makarious,PhD

National Institutes of Health | 华盛顿特区

临床数据分析师

Lietsel Jones,MSc

Data Tecnica International | 贝塞斯达

研究员

Zih-Hua Fang,PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | 美国