مكونات الدفعة العاشرة من بيانات GP2

يونيو 30, 2025

بواسطة هامبتون ليونارد، مايك أ. نولز، دان فيتال، ماثيو كوريتسكي، كريستين ليفين، ماري ب. ماكاريوس، ليتسيل جونز، زي-هوا فانغ، و جاي سي. سولّي

لمحة عامة

في تموز/يوليو 2025، أعلن البرنامج العالمي حول الجينات المرتبطة بداء باركنسون GP2 عن إطلاق الدفعة العاشرة من البيانات على منصتي Terra وVerily®Workbench بالتعاون مع منصة AMP® PD. تشمل هذه الدفعة بيانات 11،109 مشاركين إضافيين تم تصنيفهم حسب النموذج الوراثي بالإضافة إلى 13،339 مشاركًا تم ترتيبهم وفقًا لتسلسل الجينوم الكامل.

  • تحتوي بيانات الأنماط الوراثية (بيانات مصفوفة Neurobooster) حالياً، بما في ذلك العينات المقيدة محلياً، على بيانات 82,944 مشاركاً تم تصنيفهم حسب النموذج الوراثي (336،939 فرداً من مرضى باركنسون و 19,821 فرداً من مجموعة الضبط و 26,184 فرداً من تصنيفات «أخرى»).
    • وبعد استبعاد العينات المقيدة محلياً، تضم هذه البيانات حالياً 65,303 مشاركين (28,586 فرداً من مرضى باركنسون و 15,258 فرداً من مجموعة الضبط 21,459 فرداً من تصنيفات «أخرى»)
  • تضم بيانات تسلسل الجينوم الكامل اليوم ما مجموعه 21,073 مشاركاً تم ترتيبهم وفقاً لهذا التسلسل (8,134 فرداً من مرضى باركنسون 3,531 فرداً من مجموعة الضبط 9,408 أفراد من تصنيفات «أخرى»).
    • بعد استبعاد العينات المقيدة محلياً، تضم هذه البيانات 16,608 مشاركين (6,801 مشارك من مرضى باركنسون 3,244 فرداً من مجموعة الضبط 6,563 فرداً من تصنيفات «أخرى»).
    • تجدر الإشارة هنا إلى أن الحالات التي تم حشدها من خلال شبكة أحادي الجينة صنفت كحالات «أخرى».
  • تحتوي بيانات الإكسوم السريرية الآن على 10,454 عينة من مرضى الباركنسون (الدفعة الثامنة).
  • من بين العينات الفريدة التي تتوفر حولها بيانات جينية، والبالغ عددها 92,021 عينة (مصفوفة NeuroBooster أو تسلسل الجينوم الكامل أو بيانات الإكسوم السريرية)، هناك معلومات سريرية إضافية أوسع نطاقاً ل 26,982 فردًا.

ما الجديد في هذه الدفعة؟

توسيع بيانات الجينومتنطوي هذه الدفعة على توسع كبير في عدد المشاركين الذين تتوفر حولهم بيانات جينية. لقد أضفنا:

  • 11,109 مشاركين جدد تتوفر حولهم بيانات النموذج الوراثي (بيانات مصفوفة Neurobooster
  • 13,339مشاركًا جديداً تتوفر حولهم بيانات مرتبة وفقاً لتسلسل الجينوم الكامل
  • 12,311 مشاركاً جديداً تتوفر حولهم بيانات سريرية أوسع نطاقاً
  • ملف أسري (ودليل للبيانات ذات الصلة) يوضّح تقديرات حول درجة القرابة بين الأزواج (من الأفراد). ويشمل الملف العلاقات التي تم استنتاجها (باستخدام معاملات الارتباط) وتلك التي تم ذكرها صراحةً.

شمول منطقة (PAR) في عملية استخلاص البيانات لقد أعدنا طرح منطقة الصبغة الوراثية الزائفة pseudoautosomal Region (PAR) في استخلاص بيانات مصفوفة النموذج الوراثي، ما حسّن من نطاق تغطية تنوعات كروموسومات الجنس وتفسيرها. وتأتي هذه الخطوة في إطار الجهود المستمرة لتحسين التغطية الجينومية والدقة في التحليل. التحديد المشترك للمتغيرات الجينية يشمل الآن مجموعات المشاركين في البحث التابعين لمنصة AMP®PD

  • حاليا، يشمل المتغير الجيني، والمُحدّد بشكلٍ مشترك ضمن تسلسل الجينوم الكامل، عينات من مجموعات المشاركين الخمس التالية التابعة لمنصة AMP®PD: BioFind وPPMI وLCC وSTEADY-PD3 وSURE-PD3.
    • تمت معالجة هذه البيانات بالتعاون مع برنامج GP2 بدلاً من معالجتها بشكلٍ مستقل، ما يُقلّل من احتمالية فقدان البيانات والتحيّزات ويُحسّن من دقة النماذج الوراثية.
  • أضفنا خانة تحتوي على المعلومات المشفرة حول الأفراد، وذلك لبيان عينات GP2 المشمولة أيضاً في مجموعة بيانات AMP-PD.

الاحتساب المقصود للمتغير rs3115534 في سلالات مختارة بعد أن وُجد أن هناك علاقة بين المتغير الإنتروني rs3115534 وارتفاع خطر الإصابة بداء باركنسون واضطراب نوم حركة العين السريعة، والتي تم التحقق من صحتها وظيفياً، عملنا على تنفيذ استراتيجية مقصودة لضمان شمول هذا المتغير في مجموعات البيانات التي تم إصدارها.

  • تم احتساب كروموسوم 1، على وجه التحديد، لخمس سلالات (AFR وAAC وAMR وMDE وCAH)، وذلك باستخدام اللائحة المرجعية الخاصة بالمرحلة الثالثة من مشروع «1000 Genomes»، والتي تنطوي على تغطية أعمق من خلال تكرار قراءة الجينوم لـ30 مرة.
  • بعد إنهاء عملية الاحتساب، تم دمج بيانات متغير rs3115534 مرة أخرى في ملفات TOPMed المتوفرة مع دفعات البيانات من GP2. نرجو التنويه إلى أن مصفوفات الاحتساب لهذا المتغير لم تصل إلى الحد الأدنى المطلوب من الجودة (R² < 0.3) في سلالات أخرى.
مصفوفات حساب متغير rs3115534 في الدفعة العاشرة باستخدام اللائحة المرجعية للمرحلة الثالثة (30x) من مشروع «1000 Genomes»
السكان الحالة AF MAF AVG_CS R2
AFR محتسبة 0.761049 0.238951 0.992879 0.968831
AAC محتسبة 0.855586 0.144414 0.993458 0.959606
AMR محتسبة 0.983414 0.0165855 0.991453 0.507857
MDE محتسبة 0.980407 0.0195926 0.990912 0.584081
CAH محتسبة 0.93793 0.0620703 0.993982 0.909959

ملخص جديد للإحصائيات متوفر الآن لقد وفرنا العديد من ملخصات الإحصائيات حول مجموعات بيانات دراسات ارتباط الجينات ببعض الأمراض، وحرصنا على توسيع التمثيل العالمي فيها لتشمل المجموعات التالية:

  • الدراسة الأوروبية الوصفية لبرنامج GP2 حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة:; GitHub)
  • الدراسة الجنوب إفريقية حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة-معلّقة: GitHub)
  • الدراسة الهندية حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة; GitHub)
  • دراسة ارتباط الجينات باضطراب نوم حركة العين السريعة (نسخة ما قبل الطباعة: GitHub معلّقة)
  • دراسة Large-PD حول ارتباط الجينات ببعض الأمراض، والتي تشمل مشاركين من أمريكا اللاتينية (نسخة ما قبل الطباعة: GitHub- معلّقة)

بيانات سريريةيحتوي هذا الإصدار على بيانات سريرية لما مجموعه 92,021 مشاركاً ممّن نمتلك معلوماتهم الجينية وبياناتهم السريرية الأساسية. وتتوفر بيانات الأنماط الظاهرية السريرية العميقة لـ 26,982 مشاركاً من هؤلاء. وتشمل هذه المعلومات:

  • العمر عند التشخيص وبداية المرض
  • التشخيصات الأولية والحالية والأحدث
  • الاختبارات الإدراكية مثل الاختبار المُصغَّر للحالة العقلية (MMSE) وتقييم مونتريال الإدراكي (MoCA)
  • مراجعة مقياس تصنيف داء باركنسون الموحد برعاية جمعية اضطرابات الحركة (MDS-UPDRS)
  • أنماط ظاهرية «أخرى» مُفصّلة، مثل خرف أجسام ليوي (LBD)

بيانات على المستوى الفردي نعمل في الوقت الحالي على جمع البيانات من 124 مجموعة من المشاركين. يُرجى مراجعة لوحة متابعة معلومات المشاركين في GP2 للمزيد من المعلومات حول مجموعات المشاركين التي تمت مشاركتها.  تنقسم سلالات المشاركين في مصفوفة التصنيف بحسب النموذج الوراثي في GP2، والتي تم تحديدها وفقًا للجينات، إلى 11 مجموعة من سلالات النسب. وتوضح الجداول أدناه تفاصيل السلالات المُحدّدة بحسب جينات المشاركين في هذه الدفعة، والتي خضعت لمعايير ضبط الجودة وبيانات تسلسل الجينوم الكامل. تعكس هذه الأرقام العينات من دفعات سابقة، والتي تم إعادة تصنيفها باستخدام ملف المجموعة المُحدّث، الذي خضع لضبط الجودة بالإضافة إلى العينات الجديدة التي تم تصنيفها وراثياً في هذه الدفعة. يعرض الجدول النهائي معلومات حول السلالات المُحدّدة على أساس الجينات لأنماط ظاهرية أخرى غير مرتبطة بداء باركنسون.

بيانات المصفوفة المُصنَّفة بحسب النموذج الوراثي – دفعة برنامج GP2 العاشرة
السلالة المجموع (+VWB) مرضى باركنسون (+VWB) حالات الضبط (+VWB) حالات أخرى (+VWB)
الإفريقية 3,754 (3,780) 1,181 (1191) 2,305 (2,307) 268 (282)
الإفريقية المختلطة 1,192 (1,215) 361 (370) 760 (763) 71 (82)
اليهودية الأشكنازية 3,265 (3,472) 1,482 (1,531) 408 (435) 1,375 (1,506)
اللاتينية وسلالة السكان الأصليين في الأمريكيتين 3,564 (3,608) 1,974 (1,995) 1,433 (1,439) 157 (174)
شرق آسيا 6,619 (6,662) 2,393 (2,411) 2,697 (2,705) 1,529 (1,546)
الأوروبية 41,901 (58,823) 18,703 (26,778) 5,899 (10,372) 17,299 (21,673)
جنوب آسيا 801 (945) 270 (317) 260 (269) 271 (359)
آسيا الوسطى 1670 (1691) 776 (782) 624 (626) 270 (283)
الشرق أوسطية 1349 (1,493) 675 (752) 535 (559) 139 (182)
الفنلندية 116 (144) 87 (106) 8 (12) 21 (26)
المختلطة المُركّبة 1,072 (1,111) 684 (706) 329 (334) 59 (71)
المجموع 65,303 (82,944) 28,586 (36,939) 15,258 (19,821) 21,459 (26,184)

 

بيانات تسلسل الجينوم الكامل – الدفعة العاشرة لبرنامج GP2
السلالة المجموع (+VWB) مرضى باركنسون (+VWB) حالات الضبط (+VWB) حالات أخرى (+VWB)
الإفريقية 1,671 (1,696) 646 (656) 848 (853) 177 (187)
الإفريقية المختلطة 254 (267) 126 (130) 113 (114) 15 (23)
اليهودية الأشكنازية 1,389 (1,485) 337 (355) 100 (106) 952 (1,024)
اللاتينية وسلالة السكان الأصليين في الأمريكيتين 301 (333) 154 (171) 24 (24) 123 (138)
شرق آسيا 2,525 (2,542) 576 (582) 343 (343) 1,606 (1,617)
الأوروبية 8,354 (12,461) 4,155 (5,389) 1,131 (1,397) 3,068 (5,675)
جنوب آسيا 309 (417) 47 (73) 10 (16) 252 (328)
آسيا الوسطى 833 (840) 259 (261) 329 (330) 245 (249)
الشرق أوسطية 788 (824) 386 (394) 308 (309) 94 (121)
الفنلندية 22 (30) 17 (20) 4 (4) 1(6)
المختلطة المُركّبة 162 (178) 98 (103) 34 (35) 30 (40)
المجموع 16,608 (21,073) 6,801 (8,134) 3,244 (3,531) 6,563 (9,408)

 

النمط الظاهري «حالات أخرى» – الدفعة العاشرة لبرنامج GP2 (على منصة VWB)
السلالة بوادر المرض NBA/WGS PSP NBA/ WGS AD NBA/WGS DLB NBA/ WGS MSA NBA/ WGS CBD/CBS NBA/WGS FTD NBA/WGS
الإفريقية 16/7 6/4 0/0 2/0 7/4 1/0 0/0
الإفريقية المختلطة 23/7 4/2 1/0 0/0 2/0 1/0 0/0
اليهودية الأشكنازية 308/71 23/12 9/0 14/6 8/3 4/3 2/1
اللاتينية وسلالة السكان الأصليين في الأمريكيتين 30/11 5/0 5/0 2/0 2/0 1/0 0/0
شرق آسيا 27/4 14/63 4/4 18/0 6/178 2/32 0/0
الأوروبية 4206/848 1307/ 920 484/136 442/340 421/ 334 166/159 65/63
جنوب آسيا 3/2 34/32 1/0 5/1 5/8 9/9 2/2
آسيا الوسطى 4/4 4/1 70/72 4/1 1/0 4/1 0/0
الشرق أوسطية 14/1 9/4 2/2 1/0 0/0 1/1 1/1
الفنلندية 9/0 2/1 2/0 0/0 1/1 0/0 1/0
المختلطة المُركّبة 9/2 7/5 5/4 3/1 1/0 0/0 1/1
المجموع 4649/957 1415/ 1044 583/218 491/349 454/ 528 189/205 72/68

 

لمحة عن البيانات السريرية – الدفعة العاشرة لبرنامج GP2 (على منصة VWB)
البيانات السريرية العدد (هويات فريدة) العدد (هويات مع متابعة)
العمر عند جمع العينة 71,747
العمر عند بداية المرض 38,718
العمر عند التشخيص 31,667
معلومات أساسية حول تاريخ العائلة 92,021
المعلومات الديموغرافية 26,701
مرحلة Hoehn وYahr 11,486 5,515
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الأول 2,359 1,057
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثاني 2,338 1,049
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثالث 3,606 1,084
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الرابع 1,739 1,090
مقياس تصنيف داء باركنسون الموحد (UPDRS) (UPDRS) – درجة القسم الأول 5,168 2,802
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثاني 5,242 2,854
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثالث 7,532 2,870
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الرابع 2,479 1,016
تقييم مونتريال الإدراكي (MOCA) 9,500 2,753
الاختبار المُصغَّر للحالة العقلية (MMSE) 1,954
درجة اضطراب نوم حركة العين السريعة 3,986 3,290
صدمات الرأس 5,495 3,747
المؤشرات الحيوية الأساسية 5,895 4,035
حاسة الشم 5,200 1,466

الوصول إلى البيانات

العيّنات المقيدة محلياً بموجب قانون حماية البيانات العامة المُتاحة بواسطة Verily Viewpoint Workbench سوف نستمر في تجريب إمكانية السماح لبعض المستخدمين بالوصول إلى العيّنات المقيدة محلياً، والتي تُعرف بالعيّنات الخاضعة لسياسة قانون حماية البيانات العامة، وذلك من خلال تعاوننا مع Verily Viewpoint Workbench. وبينما يستمر برنامج GP2 في تطوير حلول لمشاركة البيانات المحميّة بموجب قانون حماية البيانات العامة، سوف تكون الدفعة العاشرة متوفرة حصراً لأعضاء ائتلاف برنامج GP2 وشركائه مع بعض القيود الإقليمية. ومع استمرار اختبار هذه الحلول وتنفيذها في عام 2025، سوف تصبح هذه الحلول متوفرة لمجتمع الباحثين الأوسع في وقتٍ لاحق. يمكن إيجاد كل عيّنات الدفعة العاشرة على Workbench بينما توجد كل عيّنات الدفعة العاشرة التي لا تخضع لقانون حماية البيانات العامة على مساحة العمل الجماعية على Terra (تماماً مثل كل الدفعات السابقة). ومن أجل الإطلاع على الدفعة الكاملة من البيانات على Verily Viewpoint Workbench، عليك القيام بما يلي:

  1. الحصول على تصريح للدخول إلى المستوى الثاني من بيانات GP2
  2. تعبئة نموذج طلب عيّنة خاضعة لقانون حماية البيانات العامة.
  3. الحصول على عضوية ائتلاف GP2 (من خلال المساهمة بمجموعة من المشاركين، أو الشراكة مع برنامج GP2 أو العضوية في فريق إجراء التحاليل)

سوف نعمل على تعزيز التنوع في مجموعات المشاركين في الدفعات القادمة من البيانات. يمكنكم الإطلاع على لوحة متابعة معلومات المشاركين لمواكبة التقدم المحرز. يُمكن للمستخدمين الذين يملكون إذن الدخول إلى المستوى الثاني من البيانات استكشاف هذه البيانات على متصفح المجموعات المشاركة، والتي تم الحديث عنها بشكل موسّع في مدونة سابقة وكالعادة، يُرجى العودة إلى ملف README الذي يرافق كل دفعة من بيانات GP2 للمزيد من التفاصيل حول المسارات والبيانات والتحليلات.

تعرف على المؤلفين

قائد شبكة البحث التعاوني

هامبتون ليونارد

National Institute on Aging/National Institutes of Health | الولايات المتحدة

مستشار

حاصل على شهادة الدكتوراة ،مايك أ. نولز

National Institutes of Health | الولايات المتحدة

عالم بيانات

دان فيتال

National Institutes of Health | الولايات المتحدة

مهندس بيانات وبرمجيات

حاصل على شهادة البكالوريوس ،ماثيو كوريتسكي

National Institutes of Health | واشنطن

عالمة بيانات

حاصلة على شهادة الماجستير ،كريستين ليفين

Data Tecnica International | الولايات المتحدة

عالمة بيانات طبية حيوية (متعاقدة)

حاصلة على شهادة الدكتوراة ،ماري ب. ماكاريوس

National Institutes of Health | واشنطن

محللة بيانات سريرية

حاصلة على شهادة الماجستير ،ليتسيل جونز

Data Tecnica International | بيثيسدا

عالمة

حاصلة على شهادة الدكتوراة ،زي-هوا فانغ

German Center for Neurodegenerative Diseases

Member, Senior Associate Director

جاي سي. سولّي

The Michael J. Fox Foundation for Parkinson's Research, The Michael J. Fox Foundation for Parkinson's Research | الولايات المتحدة