GP2第10回データリリースの内容

6月 30, 2025

Hampton Leonard、Mike A. Nalls、Dan Vitale、Mathew Koretsky、Kristin Levine、Mary B Makarious、Lietsel Jones、Zih-Hua Fang、J C. Solle より

概要

2025年7月、GP2はAMP® PDと共同でTerraとVerily® Workbenchプラットフォーム上の10回目のデータリリースを発表しました。このリリースで11,109人の参加者の遺伝子が同定され、13,339人のWGS参加者が追加されました。

  • エリア限定サンプルを含む遺伝子型アレイデータ(NBA)は、計82,944人の遺伝子型同定参加者(PD事例36,939、対照群19,821、「その他」表現型26,184)で構成されます。
    • エリア限定サンプルを削除すると、サンプル数65,303(PD事例28,586、対照群15,258、「その他」表現型21,459)で構成されます。
  • 全ゲノム解析(WGS)は現在、計21,073人の同定参加者(PD事例8,134、対照群3,531、「その他」表現型9,408)で構成されます。
    • エリア限定サンプルを削除すると、参加者16,608人(PD事例6,801、対照群3,244、「その他」表現型6,563)で構成されます。
    • モノジェニックネットワークで募集された事例は「その他」となります。
  • 臨床エクソームデータは現在、PDサンプル10,454(リリース8)です。
  • 遺伝子データ(NBA、WGS、または臨床エクソソーム)を持つ92,021の固有サンプルのうち、26,982は追加の様々な臨床情報を持っています。

このリリースの新しい情報

ゲノムデータの拡充 今回のリリースでは、利用可能な遺伝子データを持つ参加者が大幅に拡大されました。以下を追加しました:

  • 遺伝子型アレイ(NBA)データを持つ11,109人の新規参加者
  • 全ゲノム配列同定(WGS)データを持つ13,339人の新規参加者
  • 様々な臨床データを持つ12,311人の新規参加者
  • 家族内の個人間のペア親等推定を報告する家族ファイル(および対応データ辞書)。推論された関係(親族係数あり)と報告された関係の両方が含まれています。

インピュテーションにPAR領域を含める 遺伝子型配列データのインピュテーションに擬似常染色体(PAR)領域を再導入し、性染色体変異のカバレッジと解釈を改善しました。今回の機能強化は、ゲノムカバレッジと解析精度を高めるための継続的な取り組みの一環です。AMP®PDコホートを含む共同募集を開始

  • 共同でコールされるWGS変異セットには、現在以下の5つのAMP® PDコホートからのサンプルが含まれています:BioFind、PPMI、LCC、STEADY-PD3、SURE-PD3。
    • これらのサンプルを単独ではなくGP2とともに処理することで、欠損やアーチファクトを最小限に抑え、遺伝子型の精度を向上させます。
  • AMP-PDデータセットにも、どのGP2サンプルが存在するかを示すマスターキーのコラムを追加しました。

特定の祖先にまたがるrs3115534の標的型インピュテーション イントロニック変異rs3115534に対するコミュニティの強い関心を受け、パーキンソン病やレム睡眠行動障害リスク増加と関連があり、機能的に検証されていることを踏まえ、今回、公開されたデータセットに確実に含めるための標的型インピュテーション戦略を実施しました。

  • 具体的には、1000ゲノムフェーズ3、30倍ハイカバレッジ参照パネルを用いて、5つの祖先(AFR、AAC、AMR、MDE、CAH)について1番染色体をインピュートしました。
  • インピュテーションに続いて、rs3115534のデータはGP2リリースで提供されたTOPMedベースのインピュテーションファイルに統合されました。この変異のインピュテーションメトリックは他の祖先グループで品質の閾値(R² < 0.3)を満たしていなかったことに注意してください。
rs3115534フェーズ3 30×1000ゲノムパネルを使用した10種のインピュテーションメトリクスのリリース
人口 ステータス AF MAF AVG_CS R2
AFR インピュテーション 0.761049 0.238951 0.992879 0.968831
AAC インピュテーション 0.855586 0.144414 0.993458 0.959606
AMR インピュテーション 0.983414 0.0165855 0.991453 0.507857
MDE インピュテーション 0.980407 0.0195926 0.990912 0.584081
CAH インピュテーション 0.93793 0.0620703 0.993982 0.909959

新たなサマリー統計が利用できます 新たなGWASサマリー統計データセットがいくつか利用になり、グローバルな状況を反映するようになりました:

  • GP2のヨーロッパ(EUR)メタ-GWAS(プレプリントGitHub
  • 南アフリカGWAS(プレプリント待ち;GitHub
  • インドGWAS(プレプリントGitHub
  • RBD(REM睡眠行動障害)GWAS(プレプリント待ち;GitHub待ち)
  • LARGE-PD GWAS、ラテンアメリカ参加者を含む(プレプリント待ち;GitHub待ち)

臨床データ このリリースには遺伝的、および主要な臨床データのある計92,021人の臨床データが含まれています。そのうち、26,982件の詳細な臨床表現型データが利用可能です。この情報は、次の内容で構成されています:

  • 診断時および発症時の年齢
  • 最初、現在、および最新の診断
  • ミニ精神状態試験(MMSE)やモントリオール認知評価(MoCA)などの認知試験
  • 運動障害社会協賛による統一パーキンソン病評価尺度(MDS-UPDRS)の改訂
  • レビー小体型認知症(LBD)など詳細な「その他」の表現型

個人レベルデータ 計104のコホートからデータをキャプチャしましす。既に共有されているコホートの詳細については、GP2コホートダッシュボードをご覧ください。 アレイ遺伝子型同定されたGP2参加者の遺伝的祖先は、11の祖先グループに分けられています;以下の表は、このリリースで遺伝子型同定された参加者の遺伝的祖先を詳細に示し、品質管理に合格し、インピュートされたものです。これらの数値は以前のリリースのサンブルを反映し、アップデートされたクラスターファイルを用いて再クラスター化され、品質管理の対象となり、このリリース専用に新たに遺伝子型が同定されたものです。最後の表は、その他の非PD表現型の遺伝的に決定された先祖に関する情報を提供しています。

アレイ遺伝子同定データ – GP2リリース10
祖先 合計(+VWB PD(+VWB 対照群(+VWB その他(+VWB
アフリカ 3,754 (3,780) 1,181 (1191) 2,305 (2,307) 268 (282)
アフリカ混血 1,192 (1,215) 361 (370) 760 (763) 71 (82)
アシュケナージユダヤ人 3,265 (3,472) 1,482 (1,531) 408 (435) 1,375 (1,506)
ラテン、アメリカ先住民 3,564 (3,608) 1,974 (1,995) 1,433 (1,439) 157 (174)
東アジア 6,619 (6,662) 2,393 (2,411) 2,697 (2,705) 1,529 (1,546)
ヨーロッパ 41,901 (58,823) 18,703 (26,778) 5,899 (10,372) 17,299 (21,673)
南アジア 801 (945) 270 (317) 260 (269) 271 (359)
中央アジア 1670 (1691) 776 (782) 624 (626) 270 (283)
中東 1349 (1,493) 675 (752) 535 (559) 139 (182)
フィンランド 116 (144) 87 (106) 8 (12) 21 (26)
複雑な混血 1,072 (1,111) 684 (706) 329 (334) 59 (71)
合計 65,303 (82,944) 28,586 (36,939) 15,258 (19,821) 21,459 (26,184)

 

全ゲノム配列同定データ – GP2リリース10
祖先 合計(+VWB PD(+VWB 対照群(+VWB その他(+VWB
アフリカ 1,671 (1,696) 646 (656) 848 (853) 177 (187)
アフリカ混血 254 (267) 126 (130) 113 (114) 15 (23)
アシュケナージユダヤ人 1,389 (1,485) 337 (355) 100 (106) 952 (1,024)
ラテン、アメリカ先住民 301 (333) 154 (171) 24 (24) 123 (138)
東アジア 2,525 (2,542) 576 (582) 343 (343) 1,606 (1,617)
ヨーロッパ 8,354 (12,461) 4,155 (5,389) 1,131 (1,397) 3,068 (5,675)
南アジア 309 (417) 47 (73) 10 (16) 252 (328)
中央アジア 833 (840) 259 (261) 329 (330) 245 (249)
中東 788 (824) 386 (394) 308 (309) 94 (121)
フィンランド 22 (30) 17 (20) 4 (4) 1(6)
複雑な混血 162 (178) 98 (103) 34 (35) 30 (40)
合計 16,608 (21,073) 6,801 (8,134) 3,244 (3,531) 6,563 (9,408)

 

「その他」表現型 – GP2リリース10(VWB上)
祖先 前駆 NBA/WGS PSP NBA/ WGS AD NBA/WGS DLB NBA/ WGS MSA NBA/ WGS CBD/CBS NBA/WGS FTD NBA/WGS
アフリカ 16/7 6/4 0/0 2/0 7/4 1/0 0/0
アフリカ混血 23/7 4/2 1/0 0/0 2/0 1/0 0/0
アシュケナージユダヤ人 308/71 23/12 9/0 14/6 8/3 4/3 2/1
ラテン、アメリカ先住民 30/11 5/0 5/0 2/0 2/0 1/0 0/0
東アジア 27/4 14/63 4/4 18/0 6/178 2/32 0/0
ヨーロッパ 4206/848 1307/ 920 484/136 442/340 421/ 334 166/159 65/63
南アジア 3/2 34/32 1/0 5/1 5/8 9/9 2/2
中央アジア 4/4 4/1 70/72 4/1 1/0 4/1 0/0
中東 14/1 9/4 2/2 1/0 0/0 1/1 1/1
フィンランド 9/0 2/1 2/0 0/0 1/1 0/0 1/0
複雑な混血 9/2 7/5 5/4 3/1 1/0 0/0 1/1
合計 4649/957 1415/ 1044 583/218 491/349 454/ 528 189/205 72/68

 

臨床データスナップショット – GP2リリース10(VWB上)
臨床データ N、固有IDs N、フォローアップありIDs
サンプル収集時の年齢 71,747
発症年齢 38,718
診断時の年齢 31,667
基本家族歴 92,021
人口 26,701
ホーエン・ヤールの重症度分類 11,486 5,515
UPDRSパート1スコア 2,359 1,057
UPDRSパート2スコア 2,338 1,049
UPDRSパート3スコア 3,606 1,084
UPDRSパート4スコア 1,739 1,090
MDS UPDRSパート1スコア 5,168 2,802
MDS UPDRSパート2スコア 5,242 2,854
MDS UPDRSパート3スコア 7,532 2,870
MDS UPDRSパート4スコア 2,479 1,016
MOCA 9,500 2,753
MMSE 1,954
RBDスコア 3,986 3,290
頭部外傷 5,495 3,747
バイタル 5,895 4,035
スメル 5,200 1,466

データアクセス

Verily Viewpoint Workbenchを介した局所的制限のあるGDPRサンプル Verily Viewpoint Workbenchとの連携により、一部のユーザーが局所的に制限されたサンプル(一般データ保護規則(GDPR)ポリシーが適用されるサンプルとも呼ばれる)にアクセスできるようになることを発表しました。GP2は現在もGDPRで保護されたデータのデータ共有ソリューションの展開を続けており、エリア限定のリリース10はGP2コンソーシアムのメンバーとパートナーのみが利用できます。2025年も試用と実装が継続され、このソリューションはより広い研究コミュニティで利用できるようになります。リリース10のサンプルはすべてWorkbenchで、またGDPRの要件に準拠していないリリース10のサンプルはすべてTerraのコミュニティワークベンチで見ることができます(これまでのすべてのリリースと同じです)。VWB上のすべてのリリースにアクセスするには:

  1. GP2 Tier2アクセス承認を取得
  2. GDPR準拠サンプルリクエストフォームに記入
  3. GP2コンソーシアムメンバーになる(貢献コホート、GP2パートナー、またはプロジェクト分析チームメンバー)

今後のデータリリースにより、参加者の多様性が増します。ダッシュボードで進捗状況を確認していただけます。すでにTier 2にアクセスできるユーザーの場合は、コホートブラウザでより詳しくデータをを見たり、過去のブログ記事でもご覧ください。 これまでと同様、品質管理、パイプライン、データ、分析の詳細については、各GP2リリースに付属のREADMEを参照してください。

著者に会う

共同研究リード

Hampton Leonard

National Institute on Aging/National Institutes of Health | USA

コンサルタント

Mike A. Nalls、PhD

National Institutes of Health | USA

データサイエンティスト

Dan Vitale

National Institutes of Health | USA

データおよびソフトウェアエンジニア

Mathew Koretsky、BSc

National Institutes of Health | WA

データサイエンティスト

Kristin Levine、MSc

Data Tecnica International | USA

バイオメディカルデータサイエンティスト、コントラクター

Mary B Makarious、PhD

National Institutes of Health | Washington D.C.

臨床データアナリスト

Lietsel Jones、修士号

Data Tecnica International | ベセスダ

科学者

Zih-Hua Fang、PhD

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

J C. Solle

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | USA