لمحة عامة
في تموز/يوليو 2025، أعلن البرنامج العالمي حول الجينات المرتبطة بداء باركنسون GP2 عن إطلاق الدفعة العاشرة من البيانات على منصتي Terra وVerily®Workbench بالتعاون مع منصة AMP® PD. تشمل هذه الدفعة بيانات 11،109 مشاركين إضافيين تم تصنيفهم حسب النموذج الوراثي بالإضافة إلى 13،339 مشاركًا تم ترتيبهم وفقًا لتسلسل الجينوم الكامل.
- تحتوي بيانات الأنماط الوراثية (بيانات مصفوفة Neurobooster) حالياً، بما في ذلك العينات المقيدة محلياً، على بيانات 82,944 مشاركاً تم تصنيفهم حسب النموذج الوراثي (336،939 فرداً من مرضى باركنسون و 19,821 فرداً من مجموعة الضبط و 26,184 فرداً من تصنيفات «أخرى»).
- وبعد استبعاد العينات المقيدة محلياً، تضم هذه البيانات حالياً 65,303 مشاركين (28,586 فرداً من مرضى باركنسون و 15,258 فرداً من مجموعة الضبط 21,459 فرداً من تصنيفات «أخرى»)
- تضم بيانات تسلسل الجينوم الكامل اليوم ما مجموعه 21,073 مشاركاً تم ترتيبهم وفقاً لهذا التسلسل (8,134 فرداً من مرضى باركنسون 3,531 فرداً من مجموعة الضبط 9,408 أفراد من تصنيفات «أخرى»).
- بعد استبعاد العينات المقيدة محلياً، تضم هذه البيانات 16,608 مشاركين (6,801 مشارك من مرضى باركنسون 3,244 فرداً من مجموعة الضبط 6,563 فرداً من تصنيفات «أخرى»).
- تجدر الإشارة هنا إلى أن الحالات التي تم حشدها من خلال شبكة أحادي الجينة صنفت كحالات «أخرى».
- تحتوي بيانات الإكسوم السريرية الآن على 10,454 عينة من مرضى الباركنسون (الدفعة الثامنة).
- من بين العينات الفريدة التي تتوفر حولها بيانات جينية، والبالغ عددها 92,021 عينة (مصفوفة NeuroBooster أو تسلسل الجينوم الكامل أو بيانات الإكسوم السريرية)، هناك معلومات سريرية إضافية أوسع نطاقاً ل 26,982 فردًا.
ما الجديد في هذه الدفعة؟
توسيع بيانات الجينومتنطوي هذه الدفعة على توسع كبير في عدد المشاركين الذين تتوفر حولهم بيانات جينية. لقد أضفنا:
- 11,109 مشاركين جدد تتوفر حولهم بيانات النموذج الوراثي (بيانات مصفوفة Neurobooster
- 13,339مشاركًا جديداً تتوفر حولهم بيانات مرتبة وفقاً لتسلسل الجينوم الكامل
- 12,311 مشاركاً جديداً تتوفر حولهم بيانات سريرية أوسع نطاقاً
- ملف أسري (ودليل للبيانات ذات الصلة) يوضّح تقديرات حول درجة القرابة بين الأزواج (من الأفراد). ويشمل الملف العلاقات التي تم استنتاجها (باستخدام معاملات الارتباط) وتلك التي تم ذكرها صراحةً.
شمول منطقة (PAR) في عملية استخلاص البيانات لقد أعدنا طرح منطقة الصبغة الوراثية الزائفة pseudoautosomal Region (PAR) في استخلاص بيانات مصفوفة النموذج الوراثي، ما حسّن من نطاق تغطية تنوعات كروموسومات الجنس وتفسيرها. وتأتي هذه الخطوة في إطار الجهود المستمرة لتحسين التغطية الجينومية والدقة في التحليل. التحديد المشترك للمتغيرات الجينية يشمل الآن مجموعات المشاركين في البحث التابعين لمنصة AMP®PD
- حاليا، يشمل المتغير الجيني، والمُحدّد بشكلٍ مشترك ضمن تسلسل الجينوم الكامل، عينات من مجموعات المشاركين الخمس التالية التابعة لمنصة AMP®PD: BioFind وPPMI وLCC وSTEADY-PD3 وSURE-PD3.
- تمت معالجة هذه البيانات بالتعاون مع برنامج GP2 بدلاً من معالجتها بشكلٍ مستقل، ما يُقلّل من احتمالية فقدان البيانات والتحيّزات ويُحسّن من دقة النماذج الوراثية.
- أضفنا خانة تحتوي على المعلومات المشفرة حول الأفراد، وذلك لبيان عينات GP2 المشمولة أيضاً في مجموعة بيانات AMP-PD.
الاحتساب المقصود للمتغير rs3115534 في سلالات مختارة بعد أن وُجد أن هناك علاقة بين المتغير الإنتروني rs3115534 وارتفاع خطر الإصابة بداء باركنسون واضطراب نوم حركة العين السريعة، والتي تم التحقق من صحتها وظيفياً، عملنا على تنفيذ استراتيجية مقصودة لضمان شمول هذا المتغير في مجموعات البيانات التي تم إصدارها.
- تم احتساب كروموسوم 1، على وجه التحديد، لخمس سلالات (AFR وAAC وAMR وMDE وCAH)، وذلك باستخدام اللائحة المرجعية الخاصة بالمرحلة الثالثة من مشروع «1000 Genomes»، والتي تنطوي على تغطية أعمق من خلال تكرار قراءة الجينوم لـ30 مرة.
- بعد إنهاء عملية الاحتساب، تم دمج بيانات متغير rs3115534 مرة أخرى في ملفات TOPMed المتوفرة مع دفعات البيانات من GP2. نرجو التنويه إلى أن مصفوفات الاحتساب لهذا المتغير لم تصل إلى الحد الأدنى المطلوب من الجودة (R² < 0.3) في سلالات أخرى.
مصفوفات حساب متغير rs3115534 في الدفعة العاشرة باستخدام اللائحة المرجعية للمرحلة الثالثة (30x) من مشروع «1000 Genomes» | |||||
السكان | الحالة | AF | MAF | AVG_CS | R2 |
AFR | محتسبة | 0.761049 | 0.238951 | 0.992879 | 0.968831 |
AAC | محتسبة | 0.855586 | 0.144414 | 0.993458 | 0.959606 |
AMR | محتسبة | 0.983414 | 0.0165855 | 0.991453 | 0.507857 |
MDE | محتسبة | 0.980407 | 0.0195926 | 0.990912 | 0.584081 |
CAH | محتسبة | 0.93793 | 0.0620703 | 0.993982 | 0.909959 |
ملخص جديد للإحصائيات متوفر الآن لقد وفرنا العديد من ملخصات الإحصائيات حول مجموعات بيانات دراسات ارتباط الجينات ببعض الأمراض، وحرصنا على توسيع التمثيل العالمي فيها لتشمل المجموعات التالية:
- الدراسة الأوروبية الوصفية لبرنامج GP2 حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة:; GitHub)
- الدراسة الجنوب إفريقية حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة-معلّقة: GitHub)
- الدراسة الهندية حول ارتباط الجينات ببعض الأمراض (نسخة ما قبل الطباعة; GitHub)
- دراسة ارتباط الجينات باضطراب نوم حركة العين السريعة (نسخة ما قبل الطباعة: GitHub معلّقة)
- دراسة Large-PD حول ارتباط الجينات ببعض الأمراض، والتي تشمل مشاركين من أمريكا اللاتينية (نسخة ما قبل الطباعة: GitHub- معلّقة)
بيانات سريريةيحتوي هذا الإصدار على بيانات سريرية لما مجموعه 92,021 مشاركاً ممّن نمتلك معلوماتهم الجينية وبياناتهم السريرية الأساسية. وتتوفر بيانات الأنماط الظاهرية السريرية العميقة لـ 26,982 مشاركاً من هؤلاء. وتشمل هذه المعلومات:
- العمر عند التشخيص وبداية المرض
- التشخيصات الأولية والحالية والأحدث
- الاختبارات الإدراكية مثل الاختبار المُصغَّر للحالة العقلية (MMSE) وتقييم مونتريال الإدراكي (MoCA)
- مراجعة مقياس تصنيف داء باركنسون الموحد برعاية جمعية اضطرابات الحركة (MDS-UPDRS)
- أنماط ظاهرية «أخرى» مُفصّلة، مثل خرف أجسام ليوي (LBD)
بيانات على المستوى الفردي نعمل في الوقت الحالي على جمع البيانات من 124 مجموعة من المشاركين. يُرجى مراجعة لوحة متابعة معلومات المشاركين في GP2 للمزيد من المعلومات حول مجموعات المشاركين التي تمت مشاركتها. تنقسم سلالات المشاركين في مصفوفة التصنيف بحسب النموذج الوراثي في GP2، والتي تم تحديدها وفقًا للجينات، إلى 11 مجموعة من سلالات النسب. وتوضح الجداول أدناه تفاصيل السلالات المُحدّدة بحسب جينات المشاركين في هذه الدفعة، والتي خضعت لمعايير ضبط الجودة وبيانات تسلسل الجينوم الكامل. تعكس هذه الأرقام العينات من دفعات سابقة، والتي تم إعادة تصنيفها باستخدام ملف المجموعة المُحدّث، الذي خضع لضبط الجودة بالإضافة إلى العينات الجديدة التي تم تصنيفها وراثياً في هذه الدفعة. يعرض الجدول النهائي معلومات حول السلالات المُحدّدة على أساس الجينات لأنماط ظاهرية أخرى غير مرتبطة بداء باركنسون.
بيانات المصفوفة المُصنَّفة بحسب النموذج الوراثي – دفعة برنامج GP2 العاشرة | ||||
السلالة | المجموع (+VWB) | مرضى باركنسون (+VWB) | حالات الضبط (+VWB) | حالات أخرى (+VWB) |
الإفريقية | 3,754 (3,780) | 1,181 (1191) | 2,305 (2,307) | 268 (282) |
الإفريقية المختلطة | 1,192 (1,215) | 361 (370) | 760 (763) | 71 (82) |
اليهودية الأشكنازية | 3,265 (3,472) | 1,482 (1,531) | 408 (435) | 1,375 (1,506) |
اللاتينية وسلالة السكان الأصليين في الأمريكيتين | 3,564 (3,608) | 1,974 (1,995) | 1,433 (1,439) | 157 (174) |
شرق آسيا | 6,619 (6,662) | 2,393 (2,411) | 2,697 (2,705) | 1,529 (1,546) |
الأوروبية | 41,901 (58,823) | 18,703 (26,778) | 5,899 (10,372) | 17,299 (21,673) |
جنوب آسيا | 801 (945) | 270 (317) | 260 (269) | 271 (359) |
آسيا الوسطى | 1670 (1691) | 776 (782) | 624 (626) | 270 (283) |
الشرق أوسطية | 1349 (1,493) | 675 (752) | 535 (559) | 139 (182) |
الفنلندية | 116 (144) | 87 (106) | 8 (12) | 21 (26) |
المختلطة المُركّبة | 1,072 (1,111) | 684 (706) | 329 (334) | 59 (71) |
المجموع | 65,303 (82,944) | 28,586 (36,939) | 15,258 (19,821) | 21,459 (26,184) |
بيانات تسلسل الجينوم الكامل – الدفعة العاشرة لبرنامج GP2 | ||||
السلالة | المجموع (+VWB) | مرضى باركنسون (+VWB) | حالات الضبط (+VWB) | حالات أخرى (+VWB) |
الإفريقية | 1,671 (1,696) | 646 (656) | 848 (853) | 177 (187) |
الإفريقية المختلطة | 254 (267) | 126 (130) | 113 (114) | 15 (23) |
اليهودية الأشكنازية | 1,389 (1,485) | 337 (355) | 100 (106) | 952 (1,024) |
اللاتينية وسلالة السكان الأصليين في الأمريكيتين | 301 (333) | 154 (171) | 24 (24) | 123 (138) |
شرق آسيا | 2,525 (2,542) | 576 (582) | 343 (343) | 1,606 (1,617) |
الأوروبية | 8,354 (12,461) | 4,155 (5,389) | 1,131 (1,397) | 3,068 (5,675) |
جنوب آسيا | 309 (417) | 47 (73) | 10 (16) | 252 (328) |
آسيا الوسطى | 833 (840) | 259 (261) | 329 (330) | 245 (249) |
الشرق أوسطية | 788 (824) | 386 (394) | 308 (309) | 94 (121) |
الفنلندية | 22 (30) | 17 (20) | 4 (4) | 1(6) |
المختلطة المُركّبة | 162 (178) | 98 (103) | 34 (35) | 30 (40) |
المجموع | 16,608 (21,073) | 6,801 (8,134) | 3,244 (3,531) | 6,563 (9,408) |
النمط الظاهري «حالات أخرى» – الدفعة العاشرة لبرنامج GP2 (على منصة VWB) | |||||||
السلالة | بوادر المرض NBA/WGS | PSP NBA/ WGS | AD NBA/WGS | DLB NBA/ WGS | MSA NBA/ WGS | CBD/CBS NBA/WGS | FTD NBA/WGS |
الإفريقية | 16/7 | 6/4 | 0/0 | 2/0 | 7/4 | 1/0 | 0/0 |
الإفريقية المختلطة | 23/7 | 4/2 | 1/0 | 0/0 | 2/0 | 1/0 | 0/0 |
اليهودية الأشكنازية | 308/71 | 23/12 | 9/0 | 14/6 | 8/3 | 4/3 | 2/1 |
اللاتينية وسلالة السكان الأصليين في الأمريكيتين | 30/11 | 5/0 | 5/0 | 2/0 | 2/0 | 1/0 | 0/0 |
شرق آسيا | 27/4 | 14/63 | 4/4 | 18/0 | 6/178 | 2/32 | 0/0 |
الأوروبية | 4206/848 | 1307/ 920 | 484/136 | 442/340 | 421/ 334 | 166/159 | 65/63 |
جنوب آسيا | 3/2 | 34/32 | 1/0 | 5/1 | 5/8 | 9/9 | 2/2 |
آسيا الوسطى | 4/4 | 4/1 | 70/72 | 4/1 | 1/0 | 4/1 | 0/0 |
الشرق أوسطية | 14/1 | 9/4 | 2/2 | 1/0 | 0/0 | 1/1 | 1/1 |
الفنلندية | 9/0 | 2/1 | 2/0 | 0/0 | 1/1 | 0/0 | 1/0 |
المختلطة المُركّبة | 9/2 | 7/5 | 5/4 | 3/1 | 1/0 | 0/0 | 1/1 |
المجموع | 4649/957 | 1415/ 1044 | 583/218 | 491/349 | 454/ 528 | 189/205 | 72/68 |
لمحة عن البيانات السريرية – الدفعة العاشرة لبرنامج GP2 (على منصة VWB) | ||
البيانات السريرية | العدد (هويات فريدة) | العدد (هويات مع متابعة) |
العمر عند جمع العينة | 71,747 | – |
العمر عند بداية المرض | 38,718 | – |
العمر عند التشخيص | 31,667 | – |
معلومات أساسية حول تاريخ العائلة | 92,021 | – |
المعلومات الديموغرافية | 26,701 | – |
مرحلة Hoehn وYahr | 11,486 | 5,515 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الأول | 2,359 | 1,057 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثاني | 2,338 | 1,049 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثالث | 3,606 | 1,084 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الرابع | 1,739 | 1,090 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) (UPDRS) – درجة القسم الأول | 5,168 | 2,802 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثاني | 5,242 | 2,854 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الثالث | 7,532 | 2,870 |
مقياس تصنيف داء باركنسون الموحد (UPDRS) – درجة القسم الرابع | 2,479 | 1,016 |
تقييم مونتريال الإدراكي (MOCA) | 9,500 | 2,753 |
الاختبار المُصغَّر للحالة العقلية (MMSE) | 1,954 | – |
درجة اضطراب نوم حركة العين السريعة | 3,986 | 3,290 |
صدمات الرأس | 5,495 | 3,747 |
المؤشرات الحيوية الأساسية | 5,895 | 4,035 |
حاسة الشم | 5,200 | 1,466 |
الوصول إلى البيانات
العيّنات المقيدة محلياً بموجب قانون حماية البيانات العامة المُتاحة بواسطة Verily Viewpoint Workbench سوف نستمر في تجريب إمكانية السماح لبعض المستخدمين بالوصول إلى العيّنات المقيدة محلياً، والتي تُعرف بالعيّنات الخاضعة لسياسة قانون حماية البيانات العامة، وذلك من خلال تعاوننا مع Verily Viewpoint Workbench. وبينما يستمر برنامج GP2 في تطوير حلول لمشاركة البيانات المحميّة بموجب قانون حماية البيانات العامة، سوف تكون الدفعة العاشرة متوفرة حصراً لأعضاء ائتلاف برنامج GP2 وشركائه مع بعض القيود الإقليمية. ومع استمرار اختبار هذه الحلول وتنفيذها في عام 2025، سوف تصبح هذه الحلول متوفرة لمجتمع الباحثين الأوسع في وقتٍ لاحق. يمكن إيجاد كل عيّنات الدفعة العاشرة على Workbench بينما توجد كل عيّنات الدفعة العاشرة التي لا تخضع لقانون حماية البيانات العامة على مساحة العمل الجماعية على Terra (تماماً مثل كل الدفعات السابقة). ومن أجل الإطلاع على الدفعة الكاملة من البيانات على Verily Viewpoint Workbench، عليك القيام بما يلي:
- الحصول على تصريح للدخول إلى المستوى الثاني من بيانات GP2
- تعبئة نموذج طلب عيّنة خاضعة لقانون حماية البيانات العامة.
- الحصول على عضوية ائتلاف GP2 (من خلال المساهمة بمجموعة من المشاركين، أو الشراكة مع برنامج GP2 أو العضوية في فريق إجراء التحاليل)
سوف نعمل على تعزيز التنوع في مجموعات المشاركين في الدفعات القادمة من البيانات. يمكنكم الإطلاع على لوحة متابعة معلومات المشاركين لمواكبة التقدم المحرز. يُمكن للمستخدمين الذين يملكون إذن الدخول إلى المستوى الثاني من البيانات استكشاف هذه البيانات على متصفح المجموعات المشاركة، والتي تم الحديث عنها بشكل موسّع في مدونة سابقة. وكالعادة، يُرجى العودة إلى ملف README الذي يرافق كل دفعة من بيانات GP2 للمزيد من التفاصيل حول المسارات والبيانات والتحليلات.