概要
2025年7月、GP2はAMP® PDと共同でTerraとVerily® Workbenchプラットフォーム上の10回目のデータリリースを発表しました。このリリースで11,109人の参加者の遺伝子が同定され、13,339人のWGS参加者が追加されました。
- エリア限定サンプルを含む遺伝子型アレイデータ(NBA)は、計82,944人の遺伝子型同定参加者(PD事例36,939、対照群19,821、「その他」表現型26,184)で構成されます。
- エリア限定サンプルを削除すると、サンプル数65,303(PD事例28,586、対照群15,258、「その他」表現型21,459)で構成されます。
- 全ゲノム解析(WGS)は現在、計21,073人の同定参加者(PD事例8,134、対照群3,531、「その他」表現型9,408)で構成されます。
- エリア限定サンプルを削除すると、参加者16,608人(PD事例6,801、対照群3,244、「その他」表現型6,563)で構成されます。
- モノジェニックネットワークで募集された事例は「その他」となります。
- 臨床エクソームデータは現在、PDサンプル10,454(リリース8)です。
- 遺伝子データ(NBA、WGS、または臨床エクソソーム)を持つ92,021の固有サンプルのうち、26,982は追加の様々な臨床情報を持っています。
このリリースの新しい情報
ゲノムデータの拡充 今回のリリースでは、利用可能な遺伝子データを持つ参加者が大幅に拡大されました。以下を追加しました:
- 遺伝子型アレイ(NBA)データを持つ11,109人の新規参加者
- 全ゲノム配列同定(WGS)データを持つ13,339人の新規参加者
- 様々な臨床データを持つ12,311人の新規参加者
- 家族内の個人間のペア親等推定を報告する家族ファイル(および対応データ辞書)。推論された関係(親族係数あり)と報告された関係の両方が含まれています。
インピュテーションにPAR領域を含める 遺伝子型配列データのインピュテーションに擬似常染色体(PAR)領域を再導入し、性染色体変異のカバレッジと解釈を改善しました。今回の機能強化は、ゲノムカバレッジと解析精度を高めるための継続的な取り組みの一環です。AMP®PDコホートを含む共同募集を開始
- 共同でコールされるWGS変異セットには、現在以下の5つのAMP® PDコホートからのサンプルが含まれています:BioFind、PPMI、LCC、STEADY-PD3、SURE-PD3。
- これらのサンプルを単独ではなくGP2とともに処理することで、欠損やアーチファクトを最小限に抑え、遺伝子型の精度を向上させます。
- AMP-PDデータセットにも、どのGP2サンプルが存在するかを示すマスターキーのコラムを追加しました。
特定の祖先にまたがるrs3115534の標的型インピュテーション イントロニック変異rs3115534に対するコミュニティの強い関心を受け、パーキンソン病やレム睡眠行動障害のリスク増加と関連があり、機能的に検証されていることを踏まえ、今回、公開されたデータセットに確実に含めるための標的型インピュテーション戦略を実施しました。
- 具体的には、1000ゲノムフェーズ3、30倍ハイカバレッジ参照パネルを用いて、5つの祖先(AFR、AAC、AMR、MDE、CAH)について1番染色体をインピュートしました。
- インピュテーションに続いて、rs3115534のデータはGP2リリースで提供されたTOPMedベースのインピュテーションファイルに統合されました。この変異のインピュテーションメトリックは他の祖先グループで品質の閾値(R² < 0.3)を満たしていなかったことに注意してください。
rs3115534フェーズ3 30×1000ゲノムパネルを使用した10種のインピュテーションメトリクスのリリース | |||||
人口 | ステータス | AF | MAF | AVG_CS | R2 |
AFR | インピュテーション | 0.761049 | 0.238951 | 0.992879 | 0.968831 |
AAC | インピュテーション | 0.855586 | 0.144414 | 0.993458 | 0.959606 |
AMR | インピュテーション | 0.983414 | 0.0165855 | 0.991453 | 0.507857 |
MDE | インピュテーション | 0.980407 | 0.0195926 | 0.990912 | 0.584081 |
CAH | インピュテーション | 0.93793 | 0.0620703 | 0.993982 | 0.909959 |
新たなサマリー統計が利用できます 新たなGWASサマリー統計データセットがいくつか利用になり、グローバルな状況を反映するようになりました:
- GP2のヨーロッパ(EUR)メタ-GWAS(プレプリント;GitHub)
- 南アフリカGWAS(プレプリント待ち;GitHub)
- インドGWAS(プレプリント;GitHub)
- RBD(REM睡眠行動障害)GWAS(プレプリント待ち;GitHub待ち)
- LARGE-PD GWAS、ラテンアメリカ参加者を含む(プレプリント待ち;GitHub待ち)
臨床データ このリリースには遺伝的、および主要な臨床データのある計92,021人の臨床データが含まれています。そのうち、26,982件の詳細な臨床表現型データが利用可能です。この情報は、次の内容で構成されています:
- 診断時および発症時の年齢
- 最初、現在、および最新の診断
- ミニ精神状態試験(MMSE)やモントリオール認知評価(MoCA)などの認知試験
- 運動障害社会協賛による統一パーキンソン病評価尺度(MDS-UPDRS)の改訂
- レビー小体型認知症(LBD)など詳細な「その他」の表現型
個人レベルデータ 計104のコホートからデータをキャプチャしましす。既に共有されているコホートの詳細については、GP2コホートダッシュボードをご覧ください。 アレイ遺伝子型同定されたGP2参加者の遺伝的祖先は、11の祖先グループに分けられています;以下の表は、このリリースで遺伝子型同定された参加者の遺伝的祖先を詳細に示し、品質管理に合格し、インピュートされたものです。これらの数値は以前のリリースのサンブルを反映し、アップデートされたクラスターファイルを用いて再クラスター化され、品質管理の対象となり、このリリース専用に新たに遺伝子型が同定されたものです。最後の表は、その他の非PD表現型の遺伝的に決定された先祖に関する情報を提供しています。
アレイ遺伝子同定データ – GP2リリース10 | ||||
祖先 | 合計(+VWB) | PD(+VWB) | 対照群(+VWB) | その他(+VWB) |
アフリカ | 3,754 (3,780) | 1,181 (1191) | 2,305 (2,307) | 268 (282) |
アフリカ混血 | 1,192 (1,215) | 361 (370) | 760 (763) | 71 (82) |
アシュケナージユダヤ人 | 3,265 (3,472) | 1,482 (1,531) | 408 (435) | 1,375 (1,506) |
ラテン、アメリカ先住民 | 3,564 (3,608) | 1,974 (1,995) | 1,433 (1,439) | 157 (174) |
東アジア | 6,619 (6,662) | 2,393 (2,411) | 2,697 (2,705) | 1,529 (1,546) |
ヨーロッパ | 41,901 (58,823) | 18,703 (26,778) | 5,899 (10,372) | 17,299 (21,673) |
南アジア | 801 (945) | 270 (317) | 260 (269) | 271 (359) |
中央アジア | 1670 (1691) | 776 (782) | 624 (626) | 270 (283) |
中東 | 1349 (1,493) | 675 (752) | 535 (559) | 139 (182) |
フィンランド | 116 (144) | 87 (106) | 8 (12) | 21 (26) |
複雑な混血 | 1,072 (1,111) | 684 (706) | 329 (334) | 59 (71) |
合計 | 65,303 (82,944) | 28,586 (36,939) | 15,258 (19,821) | 21,459 (26,184) |
全ゲノム配列同定データ – GP2リリース10 | ||||
祖先 | 合計(+VWB) | PD(+VWB) | 対照群(+VWB) | その他(+VWB) |
アフリカ | 1,671 (1,696) | 646 (656) | 848 (853) | 177 (187) |
アフリカ混血 | 254 (267) | 126 (130) | 113 (114) | 15 (23) |
アシュケナージユダヤ人 | 1,389 (1,485) | 337 (355) | 100 (106) | 952 (1,024) |
ラテン、アメリカ先住民 | 301 (333) | 154 (171) | 24 (24) | 123 (138) |
東アジア | 2,525 (2,542) | 576 (582) | 343 (343) | 1,606 (1,617) |
ヨーロッパ | 8,354 (12,461) | 4,155 (5,389) | 1,131 (1,397) | 3,068 (5,675) |
南アジア | 309 (417) | 47 (73) | 10 (16) | 252 (328) |
中央アジア | 833 (840) | 259 (261) | 329 (330) | 245 (249) |
中東 | 788 (824) | 386 (394) | 308 (309) | 94 (121) |
フィンランド | 22 (30) | 17 (20) | 4 (4) | 1(6) |
複雑な混血 | 162 (178) | 98 (103) | 34 (35) | 30 (40) |
合計 | 16,608 (21,073) | 6,801 (8,134) | 3,244 (3,531) | 6,563 (9,408) |
「その他」表現型 – GP2リリース10(VWB上) | |||||||
祖先 | 前駆 NBA/WGS | PSP NBA/ WGS | AD NBA/WGS | DLB NBA/ WGS | MSA NBA/ WGS | CBD/CBS NBA/WGS | FTD NBA/WGS |
アフリカ | 16/7 | 6/4 | 0/0 | 2/0 | 7/4 | 1/0 | 0/0 |
アフリカ混血 | 23/7 | 4/2 | 1/0 | 0/0 | 2/0 | 1/0 | 0/0 |
アシュケナージユダヤ人 | 308/71 | 23/12 | 9/0 | 14/6 | 8/3 | 4/3 | 2/1 |
ラテン、アメリカ先住民 | 30/11 | 5/0 | 5/0 | 2/0 | 2/0 | 1/0 | 0/0 |
東アジア | 27/4 | 14/63 | 4/4 | 18/0 | 6/178 | 2/32 | 0/0 |
ヨーロッパ | 4206/848 | 1307/ 920 | 484/136 | 442/340 | 421/ 334 | 166/159 | 65/63 |
南アジア | 3/2 | 34/32 | 1/0 | 5/1 | 5/8 | 9/9 | 2/2 |
中央アジア | 4/4 | 4/1 | 70/72 | 4/1 | 1/0 | 4/1 | 0/0 |
中東 | 14/1 | 9/4 | 2/2 | 1/0 | 0/0 | 1/1 | 1/1 |
フィンランド | 9/0 | 2/1 | 2/0 | 0/0 | 1/1 | 0/0 | 1/0 |
複雑な混血 | 9/2 | 7/5 | 5/4 | 3/1 | 1/0 | 0/0 | 1/1 |
合計 | 4649/957 | 1415/ 1044 | 583/218 | 491/349 | 454/ 528 | 189/205 | 72/68 |
臨床データスナップショット – GP2リリース10(VWB上) | ||
臨床データ | N、固有IDs | N、フォローアップありIDs |
サンプル収集時の年齢 | 71,747 | – |
発症年齢 | 38,718 | – |
診断時の年齢 | 31,667 | – |
基本家族歴 | 92,021 | – |
人口 | 26,701 | – |
ホーエン・ヤールの重症度分類 | 11,486 | 5,515 |
UPDRSパート1スコア | 2,359 | 1,057 |
UPDRSパート2スコア | 2,338 | 1,049 |
UPDRSパート3スコア | 3,606 | 1,084 |
UPDRSパート4スコア | 1,739 | 1,090 |
MDS UPDRSパート1スコア | 5,168 | 2,802 |
MDS UPDRSパート2スコア | 5,242 | 2,854 |
MDS UPDRSパート3スコア | 7,532 | 2,870 |
MDS UPDRSパート4スコア | 2,479 | 1,016 |
MOCA | 9,500 | 2,753 |
MMSE | 1,954 | – |
RBDスコア | 3,986 | 3,290 |
頭部外傷 | 5,495 | 3,747 |
バイタル | 5,895 | 4,035 |
スメル | 5,200 | 1,466 |
データアクセス
Verily Viewpoint Workbenchを介した局所的制限のあるGDPRサンプル Verily Viewpoint Workbenchとの連携により、一部のユーザーが局所的に制限されたサンプル(一般データ保護規則(GDPR)ポリシーが適用されるサンプルとも呼ばれる)にアクセスできるようになることを発表しました。GP2は現在もGDPRで保護されたデータのデータ共有ソリューションの展開を続けており、エリア限定のリリース10はGP2コンソーシアムのメンバーとパートナーのみが利用できます。2025年も試用と実装が継続され、このソリューションはより広い研究コミュニティで利用できるようになります。リリース10のサンプルはすべてWorkbenchで、またGDPRの要件に準拠していないリリース10のサンプルはすべてTerraのコミュニティワークベンチで見ることができます(これまでのすべてのリリースと同じです)。VWB上のすべてのリリースにアクセスするには:
- GP2 Tier2アクセス承認を取得
- GDPR準拠サンプルリクエストフォームに記入
- GP2コンソーシアムメンバーになる(貢献コホート、GP2パートナー、またはプロジェクト分析チームメンバー)
今後のデータリリースにより、参加者の多様性が増します。ダッシュボードで進捗状況を確認していただけます。すでにTier 2にアクセスできるユーザーの場合は、コホートブラウザでより詳しくデータをを見たり、過去のブログ記事でもご覧ください。 これまでと同様、品質管理、パイプライン、データ、分析の詳細については、各GP2リリースに付属のREADMEを参照してください。