في شهر شباط/فبراير من عام 2023، أعلن البرنامج العالمي حول الجينات المرتبطة بداء باركنسون GP2 عن إصدار الدفعة الثالثة من البينات على منصة تيرا بالتعاون مع AMP® PD. هذه الدفعة مليئة بالبيانات والموارد الجديدة. تضّم هذه الدفعة 2583 مشاركاً جديداً في فئة المرض المعقد، إذ تمت إضافة هؤلاء إلى الدفعات السابقة من شبكتي المرض المعقد وأحادي الجينة. تحتوي بيانات المرض المعقد حالياً على 17485 مشاركاً تم تصنيفهم حسب النموذج الوراثي بالمجمل (9429 فرداً من مرضى باركنسون 6648 من مجموعة الضبط، و1408 من تصنيفات «أخرى»). أما مجموعات البحث التي تم ضمها إلى هذا الإصدار فهي:
- الشبكة الكندية المفتوحة لداء باركنسون (C-OPN)، وهي شبكة تعاونية تتكون من تسع جامعات ومراكز أبحاث كندية.
- النماذج الوراثية والأنماط الظاهرية السريرية لاضطرابات الحركة –بنك أدنبره للدماغ (MDGAP-EBB)، وهو بنك دماغ مقره في المملكة المتحدة.
- بنك سيدني للدماغ (SBB)، بنك دماغ مقره في أستراليا
تنقسم سلالات المشاركين في دراسة المرض المعقد في GP2، والتي تم تحديدها وفقاً للجينات، إلى عشر مجموعات (المجموعات التسعة المذكورة أدناه بالإضافة إلى عدد قليل من الأوروبيين الفنلنديين)، ويوضح الجدول أدناه خضوع السلالات المُحدّدة بحسب جينات المشاركين في دراسة المرض المعقد في هذه الدفعة لمعايير ضبط الجودة وتحديد النسب. تشمل هذه الأرقام عينات من إصدارات سابقة تمت إعادة تجميعها في فئات باستخدام ملف التجميع الجديد كما تم فحصها لضبط الجودة بالإضافة إلى العينات المتفردة لهذا الإصدار والتي تم تصنيفها وراثيا ومشاركتها في الإصدار الحالي. سوف نعمل على تعزيز التنوع في مجموعات المشاركين في الدفعات القادمة من البيانات. يمكنكم الإطلاع على لوحة متابعة معلومات المشاركين لمواكبة التقدم المحرز.
هناك تحديث هام في هذا الإصدار يتمثل في تعديل بسيط على الحدود في مسار ضبط الجودة. ولمشاركة المزيد من العينات قمنا بحذف المتغيرات التي تم تصنيفها حسب النموذج الوراثي ولكنها دوما تحصل على نتيجة دون المطلوب في مستوى الأداء في فحص الجودة وذلك قبل الدخول في عملية ضبط الجودة. يمكن الاطلاع على قائمة المتغيرات ذات الأداء المتدني في دليل البيانات الكبرى لمجموعات المستوى الثاني وعلى Github. استخدمنا أيضا معدلات أقل صرامة لاستثناء العينات بحيث تغيرت من 0.98 إلى 0.95. بهذه الطريقة أصبح بإمكاننا استخدام عدد أكبر من عينات للتحليل دون التضحية بالجودة.
هناك تحديث آخر في هذه الدفعة يتمثل في تحديث البيانات السريرية. العمود المخصص للأنماط الظاهرية (الأنماط الظاهرية) تم تحديثه ليشمل العناوين التالية «داء باركنسون»، «الضبط»، «أخرى». تم إضافة عمود بعنوان «أنماط ظاهرية أخرى» يوفر تشخيصا مفصلا للمشاركين الذين تم تصنيفهم تحت بند «أخرى». بعض التشخيصات المفصلة تلك تشمل الأفراد المتأثرين وغير المتأثرين من خلال الحشد المستهدف لداء باركنسون الوراثي، فحوصات لا تثبت نقص الدوبامين SWEDDS، وداء باركنسون البادري بالإضافة إلى اضطرابات أخرى مثل الرعاش مجهول السبب (ET)، الشلل فوق النووي المترقي (PSP)، الخرف المصحوب بأجسام ليوي (DLB)، أو الضمور الجهازي المتعدد (MSA).
قمنا أيضا بتحديث استدعاءات متغير رقم النسخة (CNV) لكل العينات التي تم تصنيفها وراثيا والتي نجحت في اختبار ضبط الجودة (مستوى الجين +250kb مناطق متاخمة) لكي تشمل كل العينات في الإصدار الرابع. تم تجميع هذه البيانات باستخدام ملف تجميع خاص بـGP2 للنماذج الوراثية (متوفر في قسم «الأدوات المفيدة» في المستويين الأول والثاني من الوصول إلى البيانات). يمكن العثور على ملفات المجموعة والمسار التي استخدمت للتنبؤ باحتمالات الاستثناء من متغير رقم النسخة على GP2 Githubلاستخدامها مع بيانات خارج نطاق GP2. للمزيد من المعلومات حول طريقة التجميع باستخدام ملف التصنيف الوراثي المعد خصيصا للبرنامج العالمي GP2 واحتمالات الاستثناء في متغير رقم النسخة يمكنكم الاطلاع في المقال التالي بعنوان «مكونات الإصدار الثالث للبيانات من البرنامج العالمي GP2» على مدونة GP2.
يمكن الاطلاع على مزيد من المعلومات حول هيكلية النموذج الوراثي للمرض المعقد والبيانات السريرية في المدونة التالية «مكونات الدفعة الأولى من بيانات GP2’ بالإضافة إلى README الذي تم تحديثه لهذا الإصدار ومتاح على الموقع الرسمي لمساحات عمل تيرا على موقع GP2. تجدون بيانات تسلسل الجينوم الكامل لداء باركنسون أحادي الجينة مفصلة في نفس ملف README.