في شهر كانون الأول من العام 2021، أعلن البرنامج العالمي حول الجينات المرتبطة بداء باركنسون GP2 عن إطلاق أول دفعة من بياناته على منصة الشراكة من أجل تسريع تطوير أدوية داء باركنسون (AMP-PD) . تعود البيانات المتوفرة إلى 4908 مشاركاً (3434 مشاركاً من مرضى باركنسون و1474 مشاركاً من غير المصابين بداء باركنسون) من مجموعات المشاركين من معهد كورييل وكلية بايلور للطب والرابطة المعمدانية في جامعة ميريلاند. بناءً على التركيبة الجينية، تم تقسيم أصول المشاركين إلى ثماني مجموعات. يوضح الجدول أدناه تفاصيل أصول المشاركين في الدفعة الأولى من بيانات برنامج GP2 بحسب التركيبة الجينية. سوف نعمل على تعزيز التنوع في مجموعات المشاركين في الدفعات القادمة من البيانات. يمكنكم الإطلاع علىلوحة الإعلانات لمتابعة التقدم المحرز.
بيانات النموذج الوراثي
تم تصنيف كل البيانات وفقاً للنموذج الوراثي باستخدام مصفوفة Illumina NeuroBooster، وهي مصفوفة مُصمَّمة خصيصاً لمتغيرات الأمراض العصبية الاستحالية بين أوساط المجموعات السكانية المتنوعة. تتم معالجة البيانات وفقاً لبروتوكولات Illumina المعيارية، ويستخدم برنامج GP2 مسار «ضبط الجودة» مفتوح المصدر لإدارة هذه العملية. ومن ثم يتم تقريب البيانات باستخدام TOPMed ضمن كل مجموعة من الأصول على حدى. كما تتم إزالة أي تكرار ظاهر في البيانات، ولكن تظل العينات ذات الصلة بالترتيب ذاته لضمان المرونة في تحليل المجتمعات. لمزيد من المعلومات حول ما يشمله مسار «ضبط الجودة»، يُرجى متابعة مسار العمل الوارد بالتفصيل علىصفحة GitHub ذات الصلة.
البيانات السريرية
تم تنسيق البيانات السريرية لتشكيل مجموعة بيانات سريرية موحدة لبرنامج GP2. تشمل المتطلبات الأساسية للبيانات السريرية المعلومات الديموغرافية وفئة المشاركة والتاريخ العائلي. لمزيد من المعلومات حول مستويات متطلبات البيانات الأساسية في GP2، يُرجى مراجعة وثيقة «مجموعة البيانات السريرية الأساسية» في قسم يمكن الدخول إلى البيانات عبر منصة تيرا. لمعرفة كيفية الدخول إلى بيانات GP2، يُرجى قراءة مدونة «التقدم بطلب الدخول إلى بيانات GP2 على منصة AMP®PD». تتوفر المنتجات التالية ضمن الدفعة الأولى من بيانات GP2 على منصة تيرا:
- الدخول إلى بيانات المستوى الأول
- ملخص إحصائي من أحدث دراسة حول ارتباط الجينات بداء باركنسون (باستثناء عينات «23andME» من نولز وآخرين 2019).
- الدخول إلى بيانات المستوى الثاني
- النماذج الوراثية الأولية: ملفات PLINK2.pgen لكل مجموعة من الأصول لكل العينات التي خضعت لضبط الجودة قبل تحديد القيمة
- النماذج الوراثية بعد تحديد القيمة: ملفات PlINK2.pgen بعد تحديد القيمة باستخدام لوحة مراجع TOPMed (والتي اجتازت عتبة الحد الأدنى من ضبط الجودة في ملف readme المرفق مع دفعة البيانات)
- البيانات الوصفية: تحتوي على المعلومات المرتبطة بمخرجات ضبط الجودة والتنبؤ بالأصول
- البيانات السريرية: مجالات البيانات السريرية وقاموس البيانات السريرية ذات الصلة
نأمل أن تُصبح هذه البيانات مورداً قيّماً يستفيد منه مجتمع الباحثين المهتمين بداء باركنسون. نسعى باستمرار لتحسين عملنا، لذا ترقبوا المزيد من الأخبار الشيقة من طرفنا. تم تأليف هذه المدونة من قبل كل من هامبتون ليونارد ومايك نولز وييجين سونغ ودان فيتال. يرجى زيارة صفحة GP2 لـ فريق عمل «تحليل بيانات المرض المعقد» لمعرفة المزيد عن خلفية عملهم.