مكونات الدفعة الخامسة من بيانات GP2

مايو 9, 2023

بواسطة Hampton Leonard، Mike A. Nalls، Dan Vitale، Mathew Koretsky، Kristin Levine، Mary B Makarious، و Zih-Hua Fang

في شهر أيار/مايو 2023، أعلن البرنامج العالمي حول الجينات المرتبطة بداء باركنسون GP2 عن إصدار الدفعة الخامسة من البيانات على منصة تيرا بالتعاون مع AMP®® PD.

تضّم هذه الدفعة 7462 مشاركاً جديداً في فئة المرض المعقد و487 مشاركاً جديداً في فئة المرض أحادي الجينة، إذ تمت إضافة هؤلاء إلى الدفعات السابقة من شبكتي المرض المعقد وأحادي الجينة.

  • تحتوي بيانات المرض المعقد حالياً على 24935 مشاركاً تم تصنيفهم حسب النموذج الوراثي بالمجمل (12728 فرداً من مرضى باركنسون و10533 من مجموعة الضبط و1674 من تصنيفات «أخرى»).
  • تضم بيانات المرض أحادي الجينة (تسلسل الجينوم الكامل) اليوم ما مجموعه 722 مشاركاً تم ترتيبهم وفقاً لهذا التسلسل. 

بيانات على المستوى الفردي: أما مجموعات البحث التي تم ضمها إلى هذا الإصدار فهي:

  • برنامج التبرع بالدماغ والجسد التابع لبنك أريزونا للأدمغة، وهو بنك للأدمغة يتخذ من الولايات المتحدة مقراً له
  • دراسة المناعة الطبيعية والتكيفية في داء باركنسون، وهي دراسة من جامعة ألاباما في بيرمينغهام وتتخذ من الولايات المتحدة مقراً لها
  • مجموعة IPDGC الأفريقية (IPDGCAF-NG)، وهي مجموعة من المشاركين من نيجيريا
  • PDGENEration (PDGNRTN)، وهي مجموعة من مؤسسة باركنسون
  • دراسة الجينات المرتبطة بداء باركنسون واضطرابات الحركة ذات الصلة (STELLENBOS)، وهي مجموعة جنوب أفريقية من جامعة ستيلينبوش
  • المجموعة الماليزية للجينات المرتبطة بداء باركنسون، وهي مجموعة ماليزية من جامعة مالايا
  • مجموعة الارتباطات بين الأنماط الوراثية والظاهرية في داء باركنسون واضطرابات الحركة ذات الصلة، وهي مجموعة المرض أحادي الجينة من جامعة ماليزيا
  • مستودع مركز داء باركنسون واضطرابات الحركة الحيوي، ويضم مجموعة المرض أحادي الجينة من جامعة نورث ويسترن

تنقسم سلالات المشاركين في دراسة المرض المعقد في GP2، والتي تم تحديدها وفقاً للجينات، إلى عشر مجموعات. ويوضح الجدول أدناه خضوع السلالات المُحدّدة بحسب جينات المشاركين في دراسة المرض المعقد في هذه الدفعة لمعايير ضبط الجودة وتحديد النسب. تشمل هذه الأرقام عينات من إصدارات سابقة تمت إعادة تجميعها في فئات باستخدام ملف التجميع الجديد، كما تم فحصها لضبط الجودة بالإضافة إلى العينات المتفردة لهذا الإصدار والتي تم تصنيفها وراثيا ومشاركتهاً في الإصدار الحالي. من المهم توضيح ما يلي في هذه الدفعة : STELLENBOS هي مجموعة جنوب أفريقية وتُظهر خليطاً من السلالات الجينية، الذي يعكس خصوصية المنطقة وتاريخها. من الممكن أن تتغيّر بعض توقعاتنا بخصوص سلالات أعضاء هذه الدراسة عندما نقوم بإجراء التعديل اللازم الخاص بهذا المجتمع السكاني في الدفعات المستقبلية. قدمنا في هذه الدفعة تقديرات حول هذا الخليط من السلالات فيما يخص كل المشاركين، حتى يتمكن الباحثون من اتخاذ القرار بشأن ما إذا كانوا سيدمجون مجموعات مختلطة بشكل كبير في تحليلاتهم وكيف سيفعلون ذلك كجزء من بيانات المستوى الثاني. كما حرصنا على شمول قائمة بالعينات التي نوصي بحذفها من التحليلات في هذه المرحلة، إذ أن وجود خليط من السلالات بهذا الحجم يؤدي إلى تضاؤل الثقة بصحة تقدير سلالتهم بناءً على نموذجنا الحالي.

وتم تقدير سلالة المشاركين في مجموعة المرض أحادي الجينة في برنامج GP2 بحسب الجينات، وبنفس الطريقة التي اتبعت مع المشاركين من فئة المرض المعقد. يوضح الجدول أدناه سلالة المشاركين في بيانات الدفعة الخامسة من برنامج GP2 ضمن مجموعة المرض أحادي الجينة، والتي تم تحديدها وفقاً للجينات. سوف نعمل على تعزيز التنوع في مجموعات المشاركين في الدفعات القادمة من البيانات. يمكنكم الإطلاع على لوحة المتابعة الخاصة بنا لمواكبة التقدم المحرز.

هناك تحديث مهم لهذه الدفعة ويتعلق بتغيير بسيط على كيفية تحديد المشاركين الذين يرتبطون بصلة قرابة. نستخدم برمجية KING في الوقت الحالي. ولربما يكون هذا التغيير قد أدى إلى تحديث توقعاتنا بشأن تقدير درجة الارتباط ما بين بعض المشاركين في الدفعات التي تم إصدارها في السابق. وعلى إثر هذا التغيير، سيتم تقديم ملف يوضح الحد الأدنى من درجة الارتباط المتوقعة ليكون مُتاحاً للباحثين الذين يرغبون في استخدامه لغايات غربلة البيانات الخاصة بهم. وإلى جانب هذه المكونات الأساسية المتوقعة، فإننا نوفر أيضاً المكونات الأساسية المُحتسبة لكل سلالة، والتي ستكون متاحة للتحليل في المراحل اللاحقة.

  ملخص الإحصائيات:

يسرنا أن نعلمكم بأن هناك ملخصات جديدة للإحصائيات متوفرة من خلال المستوى الأول من الوصول للبيانات لهذه الدفعة. كيم وآخرون 2023 متاح أيضاً من خلال تعاوننا المستمر مع منصة المعرفة حول المرض العصبي الاستحالي.

  • نالز وآخرون 2019 من دون «أنا و ٢٣ كروموسوم» في hg38 (أكبر دراسة أوروبية لارتباط الجينات بداء باركنسون)
  • لويش وآخرون 2021 (أكبر دراسة حول ارتباط الجينات بداء باركنسون في أوساط سكان أمريكا اللاتينية/الأمريكيون الهنود)
  • كيم وآخرون 2023 من دون «أنا و ٢٣ كروموسوم» (تحليل فوقي متعدد السلالات لخطر الإصابة بداء باركنسون ويشمل الأوروبيين، والشرق آسيويين، والأمريكيين اللاتينيين/الأمريكيين الهنود والأمريكيين من أصول أفريقية)
  • رزق وآخرون 2023 من دون «أنا و ٢٣ كروموسوم» في hg38 (أكبر دراسة أفريقية وأفريقية مختلطة حول ارتباط الجينات بداء باركنسون باستخدام بيانات الدفعة الخامسة من برنامج GP2)

متغيرات رقم النسخة:

قمنا أيضاً بتحديث استدعاءات متغير رقم النسخة (CNV) لكل العينات التي تم تصنيفها وراثياً والتي نجحت في اختبار ضبط الجودة (مستوى الجين +250kb مناطق متاخمة) لكي تشمل كل العينات في الإصدار الخامس. تم تجميع هذه البيانات باستخدام ملف تجميع خاص بـGP2 للنماذج الوراثية (متوفر في قسم «الأدوات المفيدة» في المستويين الأول والثاني من الوصول إلى البيانات). يمكن العثور على ملفات المجموعة والمسار التي استخدمت للتنبؤ باحتمالات الاستثناء من متغير رقم النسخة على GP2 Githubلاستخدامها مع بيانات خارج نطاق GP2. للمزيد من المعلومات حول طريقة التجميع باستخدام ملف التصنيف الوراثي المعد خصيصاً للبرنامج العالمي GP2 واحتمالات الاستثناء في متغير رقم النسخة، يمكنكم الاطلاع على المقال التالي بعنوان  «مكونات الإصدار الثالث للبيانات من البرنامج العالمي GP2» على مدونة GP2.

يمكن الحصول على مزيد من المعلومات حول هيكلية النموذج الوراثي للمرض المعقد والبيانات السريرية في المدونة التالية « من بيانات GP2  بالإضافة إلى README الذي تم تحديثه لهذا الإصدار ومتاح على الموقع الرسمي لمساحات عمل تيرا على موقع GP2. تجدون بيانات تسلسل الجينوم الكامل لداء باركنسون أحادي الجينة مفصلة في نفس ملف README.  وكالعادة، يُرجى العودة إلى ملف README الذي يرافق كل دفعة من بيانات GP2 للمزيد من التفاصيل حول المسارات، والبيانات والتحليلات.


بالنيابة عن مجموعات عمل «تحليل بيانات المرض المعقد» و«تحليل بيانات المرض أحادي الجينة» و«تعميم البيانات والشيفرات».

تعرف على المؤلفين

Lead of Collaborative Research

Hampton Leonard

National Institute on Aging/National Institutes of Health | الولايات المتحدة

Consultant

PhD ،Mike A. Nalls

National Institutes of Health | الولايات المتحدة

Data Scientist

Dan Vitale

National Institutes of Health | الولايات المتحدة

Postbac IRTA Fellow

BSc ،Mathew Koretsky

National Institutes of Health | الولايات المتحدة

Data Scientist

MSc ،Kristin Levine

Data Tecnica International | الولايات المتحدة

Pre-doctoral Intramural Research Training Awardee

BSc ،Mary B Makarious

National Institutes of Health | الولايات المتحدة

Scientist

PhD ،Zih-Hua Fang

The German Center for Neurodegenerative Diseases | Germany