GP2第2回データリリースの構成要素

5月 20, 2022

GP2複合疾患データ分析ワーキンググループ、Monogenic Data Analysis Working Group より

2022年4月、GP2はAMP® PDと共同でTerraプラットフォームで第2回目のデータリリースを発表しました。このリリースには、複合・モノジェニックGP2ネットワーク両方のデータが含まれています。複合疾患データは現在、合計8,644人の遺伝子型決定参加者(PD5,249人、非PD3,395人)で構成されています。本リリースでは、運動障害遺伝子型と表現型 – 英国のブレインバンクであるクイーンスクエア・ブレインバンク(MDGAP-QSBB)、そしてカザフスタンのPDコホートであるSYNAPS研究 – カザフスタン(SYNAPS-KZ)が新しく含まれています。このリリースではCORIELLサンプルも追加されています。モノジェニック疾患データは、設定基準(基準へのリンク)に基づいて選択されたPDGENErationコホートから、モノジェニック疾患ネットワーク内のPDのモノジェニック要因が疑われる有PD235人の全ゲノム配列決定(WGS)参加者で構成されています。

ジェノタイピング・マイクロアレイとWGSデータの主な違いは、ジェノタイピング中に検出される遺伝子マーカーの数です。WGSは、ヒトゲノムの32億塩基対すべてを潜在的に調査することにより、ゲノムの包括的全体像を提供します。一方、標的マイクロアレイ(GP2のカスタムNeuroBoosterアレイなど)によるジェノタイピングは、サンプルあたり最大190万個の領域タグ付けマーカーという、よりターゲットを絞った数の調査を行います。WGSは希少遺伝的変異を調査する解析に適していますが、一致性の高いリファレンスパネルに帰属するジェノタイプは、より一般的な遺伝的変異を研究するための規模の拡大縮小可能で且つ効率的なソリューションです。

複合疾患GP2参加者の遺伝的に決定された祖先は9のグループに分けられます。以下の表は品質管理とインピュテーション後のGP2リリース2の複合疾患参加者の遺伝的に決定された祖先の詳細を示しています。

モノジェニックネットワークから最初に利用可能なデータなため、遺伝的に決定されたモノジェニック疾患GP2参加者の祖先は、現時点では4つの主な祖先グループに分類されます。より多くのデータが処理されるにつれて、より多様なサンプルが利用可能になります。以下の表は、GP2リリース2におけるモノジェニック疾患参加者の遺伝的に決定された祖先を、発症年齢と家族歴別に詳述しています。

今後のデータリリースでさらに参加者の多様性が増すでしょう。ダッシュボードで進捗状況を確認することができます

最初のWGSデータを含めることに加え、新しいデータタイプを追加しました。確率的コピー数バリアント(CNV)では、品質管理に合格するすべての遺伝子型サンプル(遺伝子レベル+250kbの隣接領域)が求められます。CNVとは、DNAの特定のストレッチが繰り返される回数の変動を指します。この変動は欠失、挿入、その他の現象によって生じる可能性があり、構造的変異が疾患リスクにどう影響するかについて、より多くの情報を提供する可能性があります。確率的CNVコールを生成するために使用されるパイプラインはGP2 Github を参照してください。これは進行中の取り組みであり、より多くのデータを組み込み、パイプラインを調整するにつれて改善されます。このCNVデータは「仮説生成」と考えてください。使用上の留意点は次の四半期に予定されている最初の安定リリースをカバーするブログ投稿に含まれます。

このリリースには、NeuroBoosterアレイの遺伝子型決定された複合疾患データに加えて、モノジェニック疾患ネットワークからのWGSデータが含まれています。複合疾患の遺伝子型と臨床データ構造に関する詳細は、ブログ記事「GP2の最初のデータリリースのコンポーネント」と、各リリースごとに更新されるREADMEで詳しく説明されています。GP2 Terraの公式ワークスペースでお読みいただけます。モノジェニックPD WGSデータもREADMEに詳述されています。

このベータリリースをPD研究コミュニティに公開できることを嬉しく思います。近い将来、さらに多くの発表が予定されています!

著者に会う

GP2複合疾患データ分析ワーキンググループ

Monogenic Data Analysis Working Group