العقل العميق: نظام ذكاء اصطناعي يحل لغزًا بيولوجيًا عمره 50 عامًا

لقد حققت DeepMind بالفعل عددًا من النجاحات في تقديم مجموعة من أنظمة الذكاء الاصطناعي التي تعلمت لعب مجموعة متنوعة من الألعاب المعقدة بمهارات خارقة ، من Go և Starcraft إلى عائلة ألعاب Atari بأكملها. لكن ديميس هاسابيس ، المؤسس المشارك لشركة DeisMind الإعلامي ، جادل دائمًا بأن هذه النجاحات هي مجرد خطوة نحو هدف أكبر. الذكاء الاصطناعي الذي يساعدنا حقًا على فهم العالم.

أعلنت شركة DeepMind ، الجهة المنظمة للمسابقة طويلة المدى للتقييم النقدي لمسابقة CASP ، عن ذكاء اصطناعي يجب أن يكون له التأثير الكبير الذي تصوره حصبيس. أحدث إصدار من AlphaFold من DeepMind يحل أحد أكبر تحديات علم الأحياء هذا الإصدار هو نظام تعليمي متعمق يمكنه التنبؤ ببنية البروتين بدقة قريبة من قطر الذرة. قال جون أون مولت ، رئيس فريق CASP في جامعة ماريلاند: “هذا هو أول استخدام للذكاء الاصطناعي لحل مشكلة حقيقية”.

يتكون البروتين من سلسلة من الأحماض الأمينية التي تطوي في العديد من المنعطفات والطيات والتشابك المعقدة. تحدد هذه البنية وظيفتها. تلعب معرفة وظائف البروتينات دورًا أساسيًا في فهم الآليات الأساسية للحياة ، سواء كانت تعمل أو لا تعمل. على سبيل المثال ، ركزت الجهود المبذولة لإيجاد لقاحات ضد COVID-19 على البروتين المسماري للفيروس. تعتمد طريقة اختراق الخلايا البشرية على بيضة هذا البروتين ، البيضة على السطح الخارجي لتلك الخلايا. البروتين الرأسي هو أحد بلايين البروتينات الموجودة في جميع الكائنات الحية. يوجد مئات الآلاف من أنواع البروتينات في جسم الإنسان وحده.

خلال تجربة CASP هذا العام ، توقع ألفافولد بنية عشرات البروتينات بخطأ 1.6 أنجستروم فقط أو 0.16 نانومتر ، أي حجم الذرة. وهذا يتفوق تدريجياً على جميع طرق الكمبيوتر الأخرى ولأول مرة يتوافق مع دقة الطرق التجريبية لتحديد بنية البروتينات في المختبر ، ونلاحظ من بين هذه الطرق: ، և علم البلورات بالأشعة السينية. هذه الطرق باهظة الثمن – بطيئة لدرجة أن اختبار بروتين واحد يمكن أن يكلف مئات الآلاف من الدولارات ، سنة من التجربة والخطأ. يمكن أن يحدد Alphafold بنية البروتين في غضون أيام قليلة.

يمكن أن يساعد هذا الاختراق الباحثين في تصميم أدوية جديدة وفهم الأمراض. على المدى الطويل ، سيساعد التنبؤ ببنية البروتين في تصميم البروتينات الاصطناعية ، مثل الإنزيمات التي تعمل على تحطيم النفايات أو إنتاج الوقود الحيوي. لا يزال الباحثون يستكشفون طرقًا لإنتاج البروتينات الاصطناعية التي تساعد على زيادة غلة المحاصيل وزيادة القيمة الغذائية للنبات.

قال محمد القريشي ، عالم أحياء النظام في جامعة كولومبيا الذي طور برنامج الكمبيوتر الخاص به للتنبؤ ببنية البروتين: “هذه خطوة أساسية إلى الأمام”. لقد كان حقًا شيئًا لم أكن أتوقع حدوثه بهذه السرعة ، إنه أمر مذهل نوعًا ما “.

قال ديفيد بيكر ، مدير معهد تصميم البروتين في جامعة واشنطن ، قائد الفريق الذي عمل في مشروع روزيتا ، عائلة من محللي البروتين ، “هذا رائع”. واصل. “إنه إنجاز عظيم ، كما فعلنا مع جو”.

أرقام فلكية

يعد تحديد بنية البروتين مهمة صعبة للغاية. بالنسبة لمعظم البروتينات ، يمتلك العلماء سلسلة من الأحماض الأمينية في الخيط ، وليس البيض الملتوي الذي تُطوى فيه. عادة ما يكون هناك عدد فلكي من الاختلافات المحتملة لكل تسلسل. يعمل الباحثون على هذه القضية منذ السبعينيات ، عندما حصل كريستيان أنفينسن على جائزة نوبل لعمله في الهيكل.

حفز إطلاق تجربة CASP في عام 1994 هذا المجال من الدراسة. ينشر منظمو هذه التجربة كل عامين متواليات من حوالي 100 من الأحماض الأمينية في البروتينات التي تم تحديد بيضها في المختبر ولم يتم الإعلان عنها بعد. تتنافس العشرات من الفرق حول العالم للعثور على الحصان المناسب لكسر تلك السلاسل من خلال البرامج. تتوفر العديد من الأدوات المستخدمة في CASP بشكل أساسي للباحثين الطبيين. ومع ذلك ، كان التقدم بطيئًا ، حيث فشلت التطورات المتزايدة على مدى عقدين من الزمن في إنتاج الأساليب التي يمكن أن تقلل العمل المختبري كثيف العمالة.

عندما دخلت DeepMind المنافسة في 2018 بأول Alphafold ، تلقت CASP الدفعة اللازمة. على الرغم من فشل Alphafold في تحقيق نتائج معملية دقيقة ، إلا أنه تفوق بشكل كبير على تقنيات الحوسبة الأخرى. قدم الباحثون الملاحظة التالية:

أكثر من نصف سجلات هذا العام تستخدم شكلاً من أشكال التدريب المتعمق ، كما يقول مولت ، “مما أدى إلى زيادة الدقة الإجمالية”. يستخدم نظام بيكر الحديث ، المسمى trRosetta ، بعض أفكار DeepMind 2018 ، لكنه لا يزال “قريبًا جدًا من المركز الثاني” ، كما يقول مولت.

يتم حساب النتائج في CASP باستخدام ما يُعرف باسم اختبار الانحراف العام (GDT) ، والذي يقيس على مقياس من 0 إلى 100 مدى تشابه الهيكل المتوقع مع حصان البروتين الفعلي الذي تحدده التجارب المعملية. حقق أحدث إصدار من Alphafold في هذه المسابقة نتائج جيدة في هذا الاختبار لجميع البروتينات. قال جون أون كلاودز ، الذي يرأس Alphafold ، إنه سجل أكثر من 90 نقطة على مقياس ثلثي مجموعة البروتين ، بينما تغلب أقوى درجات البروتين على ثاني أفضل فريق في المنافسة بفارق 25 نقطة. العقل العميق. وفي الوقت نفسه ، كان الفارق 6 نقاط فقط في عام 2018.

يعني أكثر من تسعين نقطة أن أي اختلاف بين “الهياكل الحقيقية” المتوقعة يمكن أن يُعزى إلى أخطاء تجريبية في المختبر وليس إلى أخطاء برمجية. قد يعني أيضًا أن النموذج المتوقع مناسب لوصف بديل لنموذج المختبر ضمن الاختلافات الطبيعية.

وفقًا لـ Gamper ، تم تقديم أربعة بروتينات للمنافسة ، والتي لم يكملها حكام مستقلون في المختبر ، لكن Alfafold كان قادرًا على إيجاد الهياكل المناسبة لها.

يعتقد القريشي أن الباحثين سيحتاجون إلى عشر سنوات للوصول إلى نتائج ألفافولد هذا العام ، بدءًا من عام 2018. يقول إنها قريبة من الحد المادي للدقة التي يمكنك تحقيقها. وأضاف “هذه الهياكل مرنة في الغالب ، ولا معنى للحديث عن قرارات أقل بكثير”.

أجزاء من اللغز

يتبع Alphafold عمل مئات الباحثين حول العالم ، وقد تراكمت لدى DeepMind خبرة واسعة في بناء فرق من علماء الأحياء والفيزيائيين وعلماء الكمبيوتر. سيتم نشر تفاصيل حول كيفية عمل Alphafold هذا الأسبوع في مؤتمر CASP ، وفي العام المقبل في مقال في عدد خاص من مجلة Protein Magazine. لكننا نعلم أنه يستخدم شبكة من آليات الانتباه ، وتقنيات التعلم المتعمق التي تسمح للذكاء الاصطناعي بالتدريب مع التركيز على الأجزاء الأكبر من المشكلة. تحاكي Jumper هذه الطريقة من خلال تجميع لوحة مع صورة ذات طبقات.

قامت DeepMind بتدريب Alphafold على مجموعة من حوالي 170000 بروتين تم الحصول عليها من بنك بيانات البروتين ، وهو مستودع رقمي عام مخصص للحفاظ على التسلسلات والهياكل. قارن ألفافولد العديد من تسلسلات البيانات المصرفية النموذجية ، بحثًا عن أزواج من الأحماض الأمينية التي غالبًا ما تنتهي بمثل هذه الحظيرة. ثم استخدم هذه البيانات لتخمين المسافة بين زوج من الأحماض الأمينية في الهياكل التي لم نكن نعرفها من قبل. إنه قادر على تقييم دقة افتراضاته. استغرق الأمر “عدة أسابيع” من التدريب مع 100-200 وحدة معالجة رسومات.

تعمل السيدة جان أنيت ثورنتون على بنية البروتين منذ 50 عامًا وهي من المعهد الأوروبي للمعلوماتية الحيوية ، جامعة كامبريدج ، المملكة المتحدة. وقال في مؤتمر صحفي الأسبوع الماضي “هذه القضية مطروحة منذ فترة طويلة وهذا صحيح حقا.” بدأت أعتقد أننا لن نجد حلا لذلك أبدا “.

تم تصميم العديد من الأدوية لتقليد هيكلها الجزيئي ثلاثي الأبعاد من خلال البحث عن طرق لإدخال تلك الجزيئات في البروتينات المستهدفة. بالطبع ، لا يمكن القيام بذلك إلا إذا كانت بنية هذه البروتينات معروفة. نحن نتحدث عن حالة تؤثر على حوالي ربع 20 ألف بروتين بشري ، كما يقول ثورنتون. هذا يترك 15000 بروتين على حالها لأننا لا نعرف تركيبها. وقال “سوف يفتح Alphafold آفاقًا جديدة للبحث”.

تقول DeepMind أنها تخطط لدراسة داء الليشمانيات ، وداء النوم ، والملاريا – جميع الأمراض الأفريقية التي تسببها الطفيليات. لأنه يرتبط بالعديد من البروتينات ذات البنية غير المعروفة.

من عيوب برنامج Alphafold أنه أبطأ من التقنيات المنافسة. يمكن لنظام القريشي ، الذي يستخدم الشبكة الهندسية المتكررة (RGN) ، إيجاد هياكل بروتينية أسرع بملايين المرات ، مما يعني أن النتائج تظهر ثوانٍ بدلاً من أيام. يقول قريشي إن تنبؤات نظامه أقل دقة ، لكن السرعة أكثر أهمية بالنسبة لبعض التطبيقات.

ينتظر الباحثون لمعرفة كيفية عمل Alphafold. يقول بيكر: “عندما يصفون كيفية عملها في العالم ، سوف تتفتح آلاف الأزهار”. “سيستخدمه الناس في الكثير من الأشياء المختلفة ، أشياء لا يمكننا تخيلها الآن.”

يقول قريشي: “حتى النتيجة غير الدقيقة لا تزال أخبارًا جيدة لأولئك الذين يعملون مع الإنزيمات والبكتيريا ، لكن لدينا أفضل بكثير ، فهو مرتبط بشكل مباشر بالتطبيقات الصيدلانية”.

أضف تعليق