استخدام Terra للوصول إلى البيانات وإجراء التحليلات

سيتعلم المشاركون كل ما يتعلق بـ Terra خلال هذه الدورة. يتضمن ذلك التعرف على ما يتم استخدامه من أجله (وما لا يتم استخدامه من أجله). سيتعلم المشاركون أيضًا عن الموارد الأخرى المتاحة ويحصلون على مقدمة حول أجهزة الكمبيوتر المحمولة ومنصة Google Cloud بينما يتعلمون أيضًا كيفية الاستعلام عن البيانات والوصول إلى VCF والملفات ذات الصلة.

الوحدات النمطية

Terra عبارة عن منصة تعتمد على السحابة تتيح للباحثين الوصول إلى البيانات وإجراء التحليلات والتعاون ومشاركة سير العمل بسهولة مع باحثين آخرين.

في الدرس الأول سوف تتعلم:

  • اكتشف ما هو قادم في هذه الدورة
  • تعرف على ما هو Terra وما هي استخداماته

توفر شراكة تسريع الأدوية لمرض باركنسون (AMP-PD) بوابة تحتوي على بيانات مجهولة الهوية من مرضى باركنسون ومواضيع التحكم الصحية للاستخدام من قبل الباحثين. يهدف مشروع AMP-PD إلى تسريع التجارب من خلال المؤشرات الحيوية التشخيصية والتنبؤية والتقدمية.

في هذا الدرس سوف تتعلم:

  • تعرف على كيفية الوصول إلى مجموعات بيانات AMP-PD
  • تعرف على الموارد المتاحة من AMP-PD وTerra لمساعدتك في التعلم

دفاتر الملاحظات عبارة عن ملفات تحتوي على تعليمات برمجية وتعليقات ووثائق مضمنة. قامت Terra بدمج Jupyter Notebooks، لتوفير التحليلات التفاعلية للبنية الأساسية

في هذا الدرس سوف تتعلم:

  • فهم بنية دفتر الملاحظات
  • تعرف على ما يمكنك فعله باستخدام دفتر الملاحظات
  • شاهد أمثلة على Terra Notebooks

منصة Google Cloud عبارة عن مجموعة من خدمات الحوسبة السحابية التي توفر تخزين البيانات وتحليلات البيانات والتعلم الآلي. يتم تخزين ملفات البيانات الخام وملفات البيانات السريرية لـ AMP-PD على المنصة.

Google BigQuery هو مستودع بيانات يتيح لك الاستعلام عن البيانات التي تريدها من قواعد البيانات الرئيسية. يتم تخزين عدد من قواعد بيانات AMP-PD المتاحة بتنسيق قابل للاستعلام في Google BigQuery.

في هذا الدرس سوف تتعلم:

  • تعرف على المزيد حول Google Cloud Platform وGoogle BigQuery
  • تعرف على كيفية تخزين بيانات AMP-PD في السحابة وكيفية الوصول إليها
  • شاهد العروض التوضيحية للمنصة قيد الاستخدام

الآن بعد أن تعرفت على Google Cloud Platform وBigQuery، يمكنك الانتقال إلى الحصول على البيانات من جداول Big Query إلى دفتر ملاحظاتك باستخدام SQL، وهي لغة تستخدم لإدارة البيانات واسترجاعها.

في هذا الدرس سوف تتعلم:

  • تعرف على كيفية استخدام استعلامات SQL للاستعلام عن البيانات السريرية لـ AMP-PD
  • تعرف على كيفية استخدام استعلامات SQL للاستعلام عن بيانات متغيرات AMP-PD
  • التدرب على معالجة البيانات في دفتر ملاحظات وكتابة النتائج في الدلو

بعض الملفات المتوفرة على السحابة لا يمكن الاستعلام عنها من خلال BigQuery باستخدام SQL. هذه هي ملفات البيانات الخام ويتم تخزينها في Google Buckets، ويمكن الوصول إليها من سطر الأوامر باستخدام تطبيق Python، gsutil.

في هذا الدرس سوف تتعلم:

  • تعرف على كيفية العثور على الملفات الجينية المتاحة
  • تعرف على كيفية عرض مواقع الملفات في دفتر الملاحظات
  • تعرف على كيفية استخدام gsutil للوصول إلى البيانات

إن تخزين البيانات والوصول إليها على السحابة أمر مكلف. ولكن بمجرد فهمك لهيكل التسعير واتباع بعض المبادئ الأساسية، سيكون من الممكن إبقاء تكاليفك منخفضة.

في هذا الدرس سوف تتعلم:

  • فهم هيكل التسعير لتشغيل أجهزة الكمبيوتر المحمولة والاستعلامات
  • احصل على نصائح للحفاظ على أسعارك منخفضة

في هذا الدرس، سوف تستخدم كافة المعلومات التي تعلمتها لتشغيل تحليل على Terra.

ستستخدم بيانات AMP-PD وPlink، وهي أداة تحليل ارتباط الجينوم الكامل مفتوحة المصدر، لإجراء تحليل الحالة/الشاهد باستخدام اختبار فيشر الدقيق، والذي يستخدم لتحديد ما إذا كانت هناك ارتباطات غير عشوائية بين متغيرين. سوف يختبر هذا ما إذا كان توزيع الأليلات الرئيسية والثانوية لهذا المتغير مختلفًا بشكل كبير بين المشاركين الذين تم تشخيص إصابتهم بمرض باركنسون والمشاركين الذين لم يتم تشخيص إصابتهم به.

في هذا الدرس سوف تتعلم:

  • تعرف على البرامج التي ستحتاجها وكيفية تنزيلها
  • قم بإجراء تحليل من البداية إلى النهاية في دفتر ملاحظات Terra