GP2第七次数据发布内容
返回到博客

GP2第七次数据发布内容

由 Zih-Hua Fang, Mike A. Nalls, Hampton Leonard, Mary B. Makarious, Dan Vitale, Justin C. Solle, Mathew Koretsky,理学学士, <b>Kristin Levine, 和 利特塞尔·琼斯(Lietsel Jones) | , , |
Author(s)
  • Zih-Hua Fang, PhD

    德国神经退行性疾病研究中心 | 德国

    Zih-Hua在台湾完成了学士学位,在瓦赫宁根大学和法国的巴黎高科农业学院获得了博士学位,在苏黎世联邦理工学院获得了博士后学位。她的研究兴趣和经验集中于动物育种的遗传学和基因组学。Zia-Hua在生物信息学和统计建模方面拥有6年的经验,并在短期和长期阅读的全基因组测序方面�... Read More

  • Mike A. Nalls, PhD

    Data Tecnica International公司 | 美国

    在医疗和其他科学领域的大数据集分析和方法研究方面工作十多年后,Mike于2017年初创立了Data Tecnica公司。他在大数据集、脑部疾病和基因组学的应用统计学领域发表了350多篇经过同行审议的文章(40岁之前)。他是开放科学、合作和科学透明的坚定倡导者。您可通过推特、谷歌学术或领�... Read More

  • Hampton Leonard, MS

    Data Tecnica International公司/国立卫生研究院 | 美国

    Hampton拥有数据科学和机器学习的背景,并将其应用于神经退行性疾病领域的大型多组学数据集。她热爱研究临床和组学水平的差异,以及这些差异如何影响临床试验结果。她还积极为科学社区提供培训和资源,包括创建代码笔记本、工作流程,以及设计和牵头举办编程马拉松。电子邮箱�... Read More

  • Mary B. Makarious, BSc

    国立卫生研究院 | 美国

    Mary是美国国立卫生研究院国家衰老研究所神经遗传学实验室(LNG)的研究生,师从Andrew Singleton博士和Mike Nalls博士。她在美国伊利诺伊州芝加哥的洛约拉大学学习生物信息学和神经科学,之后入职LNG,在LNG工作已有两年。她的工作包括应用机器学习和数据科学技术研究帕金森病和其它神�... Read More

  • Dan Vitale, MS

    Data Tecnica International公司 | 美国

    Dan是Data Tecnica公司的数据科学顾问,主要为国立卫生研究院国家衰老研究所的神经遗传学实验室提供咨询。他的研究重点为开放科学、遗传分析管道和软件的自动化和开发,以及机器学习。电子邮箱:[email protected]

  • Justin Solle

    Justin C. Solle, MBA

    迈克尔·J·福克斯基金会 | 美国

    Justin于2021年加入迈克尔·J·福克斯帕金森研究基金会,职务为高级副主任。他负责领导全球帕金森病遗传学项目,同时也支持帕金森进展标志物倡议的运营和招聘工作。 电子邮件: [email protected]

  • Mathew Koretsky,理学学士

    国立卫生研究院 | 美国

    本科毕业后,Mathew在美国国立卫生研究院的阿兹海默症及相关痴呆症中心担任研究员。他的工作重点是开发遗传数据处理管道,并将机器学习和数据科学技术应用于神经退行性疾病领域的基因组数据集。

  • <b>Kristin Levine, </b>美国理学硕士(MS)

    Data Tecnica International公司 | 美国

    Kristin是Data Tecnica International的数据科学家,主要为美国国立卫生研究院阿尔茨海默症及相关痴呆症中心(CARD)提供咨询服务。作为一名作家出身的数据科学家,Kristin对开放科学、普及研究工具以及尽可能改善数据的清晰度和可访问性抱有极大的热情。

  • 利特塞尔·琼斯(Lietsel Jones)

    国立卫生研究院 | 美国

    利特塞尔是 Data Tecnica 公司的分析师,她本人对流行病学和遗传学之间的交叉学科有着浓厚的兴趣。她还是 GP2 的临床数据管理员,负责收集和协调来自世界各地的大型临床数据集。

概述

2023 年 4 月,GP2 宣布与 AMP® PD 合作,在 Terra 和 Verily® Workbench 平台上进行了第七次数据发布。 此次发布的数据中又增加了 9,000 多名基因分型参与者。

  • 目前,基因型阵列数据(包括本地受限样本)共包含 54,180 例基因型参与者(28,729 例帕金森病病例、15,834 例对照和 9,617 例 “其他 ”表型)。
    • 去除本地样本后,目前共有 40,740 人(20,507例PD、11,841例对照和8,392例 “其他 “表型)。
  • 共计17,496例有深度临床表型信息的个人,也有匹配的基因信息。

此次发布有哪些新内容?

  • 新增基因分型和估算样本
  • 新增4,911人的的临床数据

通过 Verily Viewpoint Workbench引入本地受限的 GDPR 样本

通过与 Verily Viewpoint Workbench 的合作,我们正在继续试行允许访问本地受限样本,即受《一般数据保护条例》(GDPR)政策管辖的样本。

目前,随着 GP2 继续为受 GDPR 保护的数据实施数据共享解决方案,受地区限制的第 7 次发布的数据将仅提供给 GP2 联盟成员和合作伙伴。随着 2024 年初测试和实施工作的继续开展,这些解决方案将向更大范围的的研究社区开放。第六次发布的所有样本都可以在Workbench上找到,而不受 GDPR 限制的所有第六次发布样本都可以在 Terra 上的社区工作台上找到(与之前的所有发布的数据一样)。要访问 VWB 上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写 GDPR规定的样本申请表
  3. 是GP2联盟成员(贡献了队列、GP2合作伙伴或项目分析小组成员)

临床数据

本次发布包含新增 4,911 个人的深度临床表型数据。这些信息包括

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知检查,如小型精神状态检查 (MMSE) 和蒙特利尔认知评估 (MoCA)
  • 运动障碍协会赞助的统一帕金森病评分量表修订版(MDS-UPDRS)
  • 详细的 “其他 “表型,如路易体痴呆 (LBD)

在这次发布中, 17,496例有临床信息的个人都有匹配的基因信息。

个人级别的数据:

目前,我们共采集了 87 个队列的数据,其中 14 个队列是本次发布的新组群。有关已共享队列的更多信息,请参阅 GP2 队列看板

阵列基因分型的 GP2 参与者的按照基因分为 11 个血统组;下表详细列出了本次发布的基因分型参与者中通过质量控制和估算的遗传血统。这些数字包括以前发布的样本已经使用新的集群文件重新聚集,并经过质量控制,同时还包括本次发布的新基因型和共享样本。

DeepVariant-GLnexus 的全基因组序列

其他 GP2 测序数据预计将于 2024 年第三季度发布。

未来的数据发布还将继续提高参与者的多样性。您可在队列看板上查看我们的进展。对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子中对此进行了详细介绍。

关于管道、数据和分析的更多详细信息,请参考每期GP2发布所附带的README!