GP2第八次数据发布内容
返回到博客

GP2第八次数据发布内容

由 Zih-Hua Fang, Mike A. Nalls, Hampton Leonard, Mary B. Makarious, Dan Vitale, Justin C. Solle, Mathew Koretsky,理学学士, <b>Kristin Levine, 和 利特塞尔·琼斯(Lietsel Jones) | , , , |
Author(s)
  • Zih-Hua Fang, PhD

    德国神经退行性疾病研究中心 | 德国

    Zih-Hua在台湾完成了学士学位,在瓦赫宁根大学和法国的巴黎高科农业学院获得了博士学位,在苏黎世联邦理工学院获得了博士后学位。她的研究兴趣和经验集中于动物育种的遗传学和基因组学。Zia-Hua在生物信息学和统计建模方面拥有6年的经验,并在短期和长期阅读的全基因组测序方面�... Read More

  • Mike A. Nalls, PhD

    Data Tecnica International公司 | 美国

    在医疗和其他科学领域的大数据集分析和方法研究方面工作十多年后,Mike于2017年初创立了Data Tecnica公司。他在大数据集、脑部疾病和基因组学的应用统计学领域发表了350多篇经过同行审议的文章(40岁之前)。他是开放科学、合作和科学透明的坚定倡导者。您可通过推特、谷歌学术或领�... Read More

  • Hampton Leonard, MS

    Data Tecnica International公司/国立卫生研究院 | 美国

    Hampton拥有数据科学和机器学习的背景,并将其应用于神经退行性疾病领域的大型多组学数据集。她热爱研究临床和组学水平的差异,以及这些差异如何影响临床试验结果。她还积极为科学社区提供培训和资源,包括创建代码笔记本、工作流程,以及设计和牵头举办编程马拉松。电子邮箱�... Read More

  • Mary B. Makarious, BSc

    国立卫生研究院 | 美国

    Mary是美国国立卫生研究院国家衰老研究所神经遗传学实验室(LNG)的研究生,师从Andrew Singleton博士和Mike Nalls博士。她在美国伊利诺伊州芝加哥的洛约拉大学学习生物信息学和神经科学,之后入职LNG,在LNG工作已有两年。她的工作包括应用机器学习和数据科学技术研究帕金森病和其它神�... Read More

  • Dan Vitale, MS

    Data Tecnica International公司 | 美国

    Dan是Data Tecnica公司的数据科学顾问,主要为国立卫生研究院国家衰老研究所的神经遗传学实验室提供咨询。他的研究重点为开放科学、遗传分析管道和软件的自动化和开发,以及机器学习。电子邮箱:[email protected]

  • Justin Solle

    Justin C. Solle, MBA

    迈克尔·J·福克斯基金会 | 美国

    Justin于2021年加入迈克尔·J·福克斯帕金森研究基金会,职务为高级副主任。他负责领导全球帕金森病遗传学项目,同时也支持帕金森进展标志物倡议的运营和招聘工作。 电子邮件: [email protected]

  • Mathew Koretsky,理学学士

    国立卫生研究院 | 美国

    本科毕业后,Mathew在美国国立卫生研究院的阿兹海默症及相关痴呆症中心担任研究员。他的工作重点是开发遗传数据处理管道,并将机器学习和数据科学技术应用于神经退行性疾病领域的基因组数据集。

  • <b>Kristin Levine, </b>美国理学硕士(MS)

    Data Tecnica International公司 | 美国

    Kristin是Data Tecnica International的数据科学家,主要为美国国立卫生研究院阿尔茨海默症及相关痴呆症中心(CARD)提供咨询服务。作为一名作家出身的数据科学家,Kristin对开放科学、普及研究工具以及尽可能改善数据的清晰度和可访问性抱有极大的热情。

  • 利特塞尔·琼斯(Lietsel Jones)

    国立卫生研究院 | 美国

    利特塞尔是 Data Tecnica 公司的分析师,她本人对流行病学和遗传学之间的交叉学科有着浓厚的兴趣。她还是 GP2 的临床数据管理员,负责收集和协调来自世界各地的大型临床数据集。

概述

2024年9月,GP2 宣布与 AMP® PD 合作,在 Terra 和 Verily® Workbench 平台上发布第八次数据。此次发布包括5,481个额外的全基因组序列和10,454个临床外显子组序列。后续版本中将提供额外的基因分型信息。

  • 目前,全基因组测序 (WGS) 数据共包含7,734名测序参与者(6,113例PD病例、617例对照和1,004例“其他”表型)。
    • 去掉本地限制样本后,样本现包括4,713名参与者(4,098名PD病例、390名对照和225名“其他”表型)。
    • 值得注意的是,通过单基因网络招募的病例被编码为“其他”。
  • 此外,此次WGS发布中还包含两个AMP ® PD队列(BioFind 和 PPMI)的部分全基因组序列发布,这些序列已与GP2 WGS联合调用。已发布的样本可以通过发布版本中附带的ID交叉对照文件链接回原始AMP® PD ID。
  • 此次发布还包括来自帕金森基金会的10,454名联合临床外显子组测序参与者。
  • 此次发布共包含62,087名拥有核心临床数据的个人。其中,16,800人拥有深入的临床表型和遗传数据。

此次发布有哪些新内容?

  • 额外的GP2全基因组测序样本和联合调用的变体集,包括来自两个AMP ®PD队列(BioFind 和 PPMI)的样本
  • 帕金森基金会的临床外显子组数据
  • 个人临床数据增多,使我们拥有核心临床数据的个人总数达到62,087人 

通过 Verily Viewpoint Workbench引入本地受限的 GDPR 样本

通过与 Verily Viewpoint Workbench 的合作,我们正在继续试行允许访问本地受限样本,即受《一般数据保护条例》(GDPR)政策管辖的样本。目前,随着GP2继续为受GDPR保护的数据实施数据共享解决方案,受地区限制的第八次发布的数据将仅提供给GP2联盟成员和合作伙伴。随着2024年测试和实施的继续,该解决方案将可供更广泛的研究界使用。所有第八次发布的样本均可在Workbench上找到。而不受GDPR限制的所有第八次发布样本都可以在Terra上的社区工作台上找到(与之前的所有发布的数据一样)。要访问VWB上的完整版本,您必须:

  1. 有GP2二级级访问权限
  2. 填写GDPR规定的样本申请表
  3. 是GP2联盟成员(贡献队列、GP2合作伙伴或项目分析小组成员)

临床数据

此版本包含总共62,087名个人的临床数据,这些个人拥有遗传和核心临床数据。此次发布的内容包含16,800名个体的深度临床表型数据和基因数据。这些信息包括:

  • 确诊和发病年龄
  • 主要诊断、当前诊断和最新诊断
  • 认知测试,例如简易精神状态检查和蒙特利尔认知评估
  • 运动障碍协会赞助的统一帕金森病评定量表修订版
  • 详细的“其他”表型,如路易体痴呆症
  • 通过单基因网络招募的病例被编码为“其他”

临床外显子组序列

帕金森基金会提供的临床外显子组测序可用于本次发布的10,454个帕金森基金会样本,提供4,717个基因的编码区和剪接点的分析。这些针对性的测序旨在识别和报告具有潜在临床意义的变异,重点关注那些与患者临床信息和家族史相符的变异。欲了解更详细信息,请访问 Fulgent Genetics临床外显子组页面。

DeepVariant-GLnexus 的全基因组序列

我们使用Google的DeepVariant流程GLnexus进行群组级变体调用。DeepVariant是一款基于深度学习的变体调用器,通过准确的在个体级别上检测出基因变异,其性能优于现有的最先进工具。它还简化了过程,提高了准确性和可靠性。  阵列基因分型的 GP2 参与者的按照基因分为 11 个血统组;下表详细列出了本次发布的基因分型参与者中通过质量控制和估算的遗传血统。这些数字包括以前版本的样本,这些样本已经使用新的集群文件重新聚集,并通过了质量控制,同时还包括本次发布的新基因型和共享样本。 未来的数据发布还将继续提高参与者的多元性。您可在队列看板上查看我们的进展。对于已经拥有二级访问权限的用户,您可以在我们的队列浏览器上进一步浏览数据,之前的博客帖子中对此进行了详细介绍。


与往常一样,请参阅每个GP2版本附带的自述文件,以获取有关质量控制、管道、数据和分析的建议的更多详细信息!

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.