معهد ماساتشوستس للتكنولوجيا يبتكر ذكاءً اصطناعيًّا يتنبّأ بالاكتئاب من الحديث

المترجمة: رهف الخاروف
المدققة: رهف الفرج
المراجعة: ربى الشمراني
الاكتئاب هو أحد أكثر الاضطرابات شيوعًا في العالم، ووفقًا لإحصائيات منظمة الصّحة العالميّة التي صدرت في مارس/آذار عام ٢٠١٨ فهو يؤثر على حياة أكثر من ٣٠٠ مليون شخص، ويسبب نحو ٨٠٠٠٠٠ حالة انتحار كل سنة، وقد يكون تشخيص الاكتئاب تحديًا صعبًا ومعقدًا، ووفقًا لعيادة مايو كلينك (Mayo Clinic) تتنوّع أعراض الاكتئاب، وعليه قد يستخدم الأطباء لتشخيصه طرائق عدّة منها: الفحص السريري، والاختبارات المعملية، واستبيان التقويم النفسي، ومعايير من الدليل التّشخيصي والإحصائي للاضطرابات النّفسية التّابع للجمعيّة الأمريكيّة للأطبّاء النّفسيين (DSM-5 الطّبعة الخامسة)[1]. أمّا من وجهة نظر أخصّائي الصّحة العقليّة فإنّ طرح الأسئلة الصحيحة وتفسير الإجابات عاملان مهمّان في عملية التّشخيص. ولكن ماذا لو أمكن تشخيص المريض باستماع الطبيب إليه أثناء التحدّث بدلًا من التشخيص بطرح الأسئلة عليه وتحليل إجاباته؟
وجد فريق بحث مبتكر من معهد ماساتشوستس للتكنولوجيا يضمّ تقى الهنائي وجيمس غلاس -من مختبر علوم الحاسب والذكاء الاصطناعي- ومحمد قاسمي -من معهد العلوم والهندسة الطبيّة- طريقةً يتنبّأ بها الذكاء الاصطناعي بالاكتئاب عند الأشخاص وذلك بتعرّفه على أنماط المحادثات الطبيعية[٢].
طوّر الباحثون في معهد ماساتشوستس للتكنولوجيا أنموذج ذكاءٍ اصطناعيّ ذو شبكةٍ عصبيّة يمكنه التنبّؤ بالاكتئاب بتعرّفه على أنماط الكلام من التسجيلات الصوتيّة والنصيّة للمريض المأخوذة من المقابلات. سعى الفريق إلى استنباط نماذج متسلسلة مأخوذة من كلام المريض للكشف عن الاكتئاب باستخدام البيانات المأخوذة من ١٤٢ محادثة مسجّلة للمرضى، وأجرى الباحثون تجاربَ تضمّنت النمذجة الخالية من السياق، والنمذجة الموزونة، ونمذجة تسلسل الكلام[٣].
سعى الفريق أوّلًا إلى تقييم دقة تنبّؤ السّمات الصوتيّة والنّصيّة «دون ربطها بنوع السؤال المطروح ووقت طرحه في المقابلة»، وبعبارةٍ أخرى: أنموذج «خالي من السياق». وقام الفريق بتزويد أنموذج انحدار لوجستي مع تنظيم L1 بـ ٢٧٩ سمة صوتيّة و١٠٠ سمة نصيّة[٤]. ولتقييم دقة التنبّؤ بالسمات النّصيّة استفاد الفريق من خوارزميّة Doc2Vec من مكتبة (Python Gensim library) في «ما مجموعهُ ٨٠٥٠ من أمثلة التدريب، و٢٧٢٤١٨ من الكلمات، و٧٤١١ من المفردات[٥]». أمّا لتقييم دقّة التنبّؤ بالسمات الصوتيّة «استخلص الفريق مجموعة مبدئيّة من ٥٥٣ سمة تمثّل مجموع استجابات كل شخص خضع للتجربة[٦]».
وفي التجربة الثانية سعى الفريق إلى فهم الأداء التنبُئِي «بالاعتماد على نوع السؤال المطروح دون ربطه بوقت طرحه في المقابلة». ولتحقيق ذلك ابتكر الفريق أنموذج موزون شبيه بالأنموذج الخالي من السياق ويختلف عنه بتحديده قيم موزونة للأنموذج بناءً على «قوة التنبؤ المستخلصة من مجموعة الأسئلة التي طرحت في التدريب».
وركّز الفريق في التجربة الثالثة على «أنموذج التغيرات الزمنيّة في المقابلة»، واستخدم شبكة عصبية للذاكرة طويلة المدى ثنائية الاتجاه لأنّها ذات «ميزة إضافية في نمذجة البيانات المتسلسلة».
ومن المثير للاهتمام ما اكتشفه الباحثون من أن التنبؤ بحالات الاكتئاب باستخدام الصوت يحتاج إلى نماذج بيانات أكثر بأربع مرات مما يحتاجه تنبّؤ حالات الاكتئاب باستخدام النصوص، حيث احتاجت عملية النمذجة ما معدّله ٣٠ سلسلة صوت مقارنةً بسبع سلاسل نصيّة من الأسئلة والأجوبة. كما وجد الفريق أن أنموذج تسلسل الكلام أكثر دقة في التنبّؤ بحالات الاكتئاب من غيره، وأن الأنموذج المتعدد الوسائط (نص وصوت) كان الأفضل أداءً. ومن المفارقات في هذا الأمر أن طبيعة نظام الشبكة العصبية للذكاء الاصطناعي لا تنسجم تمامًا مع الأنماط التي تستخلصها من البيانات المدخلة، وتُعزا صعوبة فهم الذكاء الاصطناعي إلى التعقيد الأساسي في الشبكات العصبية والتوصيلات المتشابكة بين العقد المختلفة والمتغيرات المهولة في التجربة. عدا عن ذلك، تمثّل هذه الدراسة خطوة مبتكرة في اتجاه تطوير أداة جديدة من شأنها أن تساعد الأطباء وأخصّائيي الصحة العقلية في التعامل مع المشكلات المعقدة التي ستواجههم في تشخيص الاكتئاب مستقبلًا.
جميع حقوق النشر محفوظة © لكامي روسو ٢٠١٨
أحدث التعليقات