يُظهر الذكاء الاصطناعي للطب من Google إجابات سريرية دقيقة تزيد عن 90٪

فريق التحرير

في أحد أيام فبراير 2022 ، وجد باحثان في مجال الذكاء الاصطناعي في شركة Google التابعة لشركة Alphabet ، نفسيهما منغمسين في محادثة حول الذكاء الاصطناعي وإمكانياته للتطبيقات الحقيقية في مجال الرعاية الصحية.

بينما ناقش آلان كارثيكسالينجام وفيفيك ناتاراجان تكييف نماذج الذكاء الاصطناعي الحالية من Google مع الإعدادات الطبية ، امتدت محادثتهما لساعات وتناول العشاء على دوساس في مطعم بالقرب من مقر شركة التكنولوجيا العملاقة ماونتن فيو. بحلول نهاية المساء ، كان ناتاراجان قد كتب المسودة الأولى لوثيقة تصف إمكانيات النماذج اللغوية الكبيرة في الرعاية الصحية ، بما في ذلك اتجاهات البحث وتحدياته.

للحصول على أحدث العناوين الرئيسية ، تابع قناتنا على أخبار Google عبر الإنترنت أو عبر التطبيق.

بدأ عملهم واحدة من أكثر السباقات البحثية كثافة والتي يقول الباحثون إنهم مروا بها في وقتهم في Google. وبلغت ذروتها في نشر Med-PaLM ، وهو نموذج للذكاء الاصطناعي يقول الباحثون إن لديه القدرة على إحداث ثورة في الرعاية الصحية من خلال السماح للأطباء باستعادة المعرفة الطبية بسرعة لدعم قراراتهم السريرية. نماذج اللغات الكبيرة هي أنظمة ذكاء اصطناعي ضخمة تستوعب عادةً كميات هائلة من النصوص الرقمية ، لكن كارثيكسالينجام وناتاراجان تصورا نظامًا يتم تدريبه على المعرفة الطبية المتخصصة.

قالت جوجل يوم الأربعاء إن الأبحاث التي تمت مراجعتها من قبل النظراء والتي تدعم نموذج الذكاء الاصطناعي قد قبلتها المجلة العلمية نيتشر. وقالت إن هذا يجعل الشركة أول من ينشر بحثًا يشرح بالتفصيل نموذجًا للذكاء الاصطناعي يجيب على الأسئلة الطبية في المجلة.

تحتوي الورقة على بعض النتائج المدهشة. عندما طُرح النموذج أسئلة طبية ، صنفت مجموعة من الأطباء إجاباتها على أنها 92.6 بالمائة بما يتماشى مع الإجماع العلمي ، وهي فقط خجولة من درجة 92.9 بالمائة التي حصل عليها المهنيون الطبيون الواقعيون ، وفقًا لبيان صادر عن Nature ، على الرغم من أن لم تكن تقييمات الأطباء لـ Med-PaLM مبنية على نشرها في إعدادات المستشفى مع متغيرات المريض الواقعية. ووجدت الدراسة أيضًا أن 5.8 في المائة فقط من استجابات النموذج يمكن أن تسبب ضررًا ، متفوقة على معدل 6.5 في المائة الذي حققه الأطباء.

قالت سارة ويست ، المديرة الإدارية لمعهد AI Now Institute ، وهو مركز أبحاث للسياسات ، إنه أثناء النشر في مجلة علمية يوضح بعض الإشراف الأكاديمي على نتائج Google ، إلا أنه يعد معيارًا غير كافٍ للاستعداد لاستخدام نظام الذكاء الاصطناعي في أماكن الرعاية الصحية الحقيقية. قالت: “هناك كل أنواع المعلومات التي قد ترغب في معرفتها ، من أجل تقييم نظام ما بشكل هادف قبل نشره للاستخدام التجاري”. “وأنت بحاجة إلى إلقاء نظرة على هذا النظام على مستوى كل مستشفى ، إذا كانوا سيفعلون أي نوع من التخصيص لنظام لبيئة سريرية معينة.”

وأضاف ويست أنه بدون أي تفويضات أخرى للاختبار أو التقييم المستقل ، “نحن عالقون في موقف يتعين علينا فيه الاعتماد على كلمات الشركة التي تفيد بأنهم قاموا بتقييم أنظمة الذكاء الاصطناعي بشكل كاف قبل النشر”.

لا تزال الأيام الأولى لـ Med-PaLM. بدأت الشركة في الأشهر القليلة الماضية في فتح النموذج لمجموعة مختارة من مؤسسات الرعاية الصحية وعلوم الحياة للاختبار ، وتقول الشركة إن النموذج لا يزال بعيدًا عن الاستعداد للاستخدام في رعاية المرضى. يقول باحثو Google الذين عملوا على النموذج أنه في المستقبل ، يمكن أن يكون لدى Med-PaLM القدرة على تزويد الأطباء بمصدر خبير للتشاور عند مواجهة حالات غير مألوفة ، والمساعدة في إرهاق التوثيق السريري وتقديم الرعاية للأشخاص الذين قد لا يتلقون لولا ذلك. أي شكل من أشكال الرعاية الصحية على الإطلاق.

“هل يمكننا تحفيز مجتمع الذكاء الاصطناعي الطبي على التفكير بجدية في إمكانات النماذج الأساسية للرعاية الصحية؟” قال كاران سنغال ، مهندس برمجيات عمل في المشروع. “كان هذا هو نجمنا الذي يقودنا.”

في مارس ، أعلنت Google عن التكرار الثاني لـ Med-PaLM ، والذي قالت إنه وصل إلى درجة 86.5 في المائة عند الإجابة على الأسئلة المتعلقة بأسلوب الترخيص الطبي في الولايات المتحدة – وهو تحسن عن النتيجة السابقة البالغة 67 في المائة. تم تقييم الجيل الأول من Med-PaLM من قبل 9 أطباء من المملكة المتحدة والولايات المتحدة والهند. وقالت جوجل إن 15 طبيبا قاموا بتقييم النسخة الثانية.

تخوض شركتا Google و OpenAI ، الشركة الناشئة المدعومة من شركة Microsoft Corp ، في سباق شرس في مجال الذكاء الاصطناعي ، والمجال الطبي ليس استثناءً. ذكرت صحيفة وول ستريت جورنال أن الأنظمة الطبية بدأت في تجربة تقنية أوبن إيه آي. بدأت Google ، من جانبها ، في تجربة Med-PaLM مع Mayo Clinic ، وفقًا للمجلة.

لطالما حلم كل من Karthikesalingam و Natarajan بجلب الذكاء الاصطناعي إلى الرعاية الصحية. بعد أن بدأ حياته المهنية كطبيب ، وجد Karthikesalingam نفسه يتوق إلى نموذج ذكاء اصطناعي يمكن أن يكمل عمله. نشأ ناتاراجان في أجزاء من الهند حيث لم يكن من الممكن بالنسبة لكثير من الناس رؤية الطبيب.

قال تاو تو ، أحد أوائل الباحثين في الفريق ، إنه كان متشككًا في البداية في الجدول الزمني الطموح للفريق. قال تو: “لقد تلقيت مكالمة أولية مع فيفيك ، وقال فيفيك إننا نخطط لطباعة ورقة في غضون شهر”. “وقلت ، كيف يكون ذلك ممكنًا؟ لقد تم نشر عدد من الأوراق لسنوات عديدة. أعلم أنه لن يحدث شيء في مثل هذا النطاق الزمني القصير “.

لكن الفريق نجح في ذلك. بعد خمسة أسابيع من الجري السريع الذي امتد على عيد الشكر وعيد الميلاد ، والذي تضمن 15 ساعة عمل ، قامت المجموعة بتأليف Med-PaLM ، الجيل الأول من النموذج ، وأعلنت عن ذلك في ديسمبر.

قال الباحثون إن التقدم السريع في التكنولوجيا هو ما دفعهم إلى التحرك بهذه السرعة.

على طول الطريق ، بدأ الفريق في التعرف على أهمية ما كانوا يبنونه. بعد بعض التعديلات المبكرة ، بدأ النموذج في تحقيق درجة 63 في المائة في امتحان الترخيص الطبي ، وتجاوز الحد الأدنى للنجاح. وفي المراحل الأولى من المشروع ، كان من السهل تمييز ردود النموذج عن إجابات الأطباء بواسطة كارثيكسالينغام ، وهو طبيب ممارس. وقال سنغال إنه بحلول نهاية العملية ، لم يعد بإمكانه معرفة أيهما كان.

تُستخدم خوارزميات الذكاء الاصطناعي بالفعل في إعدادات الرعاية الصحية لمهام محددة ، مثل التصوير الطبي ، أو للمساعدة في التنبؤ بالمرضى الموجودين في المستشفى الأكثر عرضة للإصابة بالإنتان. لكن نماذج الذكاء الاصطناعي التوليدية تشكل مخاطر جديدة ، وهو ما تعترف به Google نفسها. قد تقدم النماذج ، على سبيل المثال ، معلومات طبية خاطئة بطريقة مقنعة أو تدمج التحيزات التي يمكن أن تزيد من التفاوتات الصحية القائمة.

من أجل التخفيف من هذه المخاطر ، قال باحثو Med-PaLM إنهم أدمجوا “اختبار الخصومة” في نموذج الذكاء الاصطناعي الخاص بهم. قاموا برعاية قائمة من الأسئلة المصممة لاستنباط إجابات تم إنشاؤها بواسطة الذكاء الاصطناعي مع احتمال حدوث ضرر وتحيز ، بما في ذلك مجموعة من الأسئلة التي تركز على موضوعات طبية حساسة مثل Covid-19 والصحة العقلية ، بالإضافة إلى مجموعة أخرى من الأسئلة حول العدالة الصحية. ركز الأخير على قضايا مثل التحيز العنصري في الرعاية الصحية.

قالت Google إن Med-PaLM 2 أعطت إجابات تم تصنيفها بشكل متكرر على أنها تنطوي على “مخاطر منخفضة” للضرر مقارنة بنموذجها الأول. لكنه قال أيضًا إنه لم يكن هناك تغيير كبير في قدرة النموذج على تجنب توليد معلومات غير دقيقة أو غير ذات صلة. قال شيك عزيزي ، كبير علماء الأبحاث في Google ، إنه أثناء اختبار Med-PaLM ، عندما طلبوا من نموذج الذكاء الاصطناعي تلخيص مخطط المريض أو الاستجابة بالمعلومات السريرية ، وجدوا أن Med-PaLM “قد تهلوس وتشير إلى الدراسات التي لم تكن موجودة بشكل أساسي ، أو لم يتم توفيرها “.

قال ميريديث ويتاكر ، رئيس مؤسسة Signal ، التي تدعم المراسلة الخاصة ومدير Google السابق. كما أنها قلقة بشأن احتمالية “نشر هذه التكنولوجيا في الأماكن التي يتم فيها معايرة الحوافز بالفعل لتقليل مقدار الرعاية ومقدار الأموال التي يتم إنفاقها على رعاية الأشخاص الذين يعانون”.

في عرض توضيحي لمراسلي بلومبرج ، عرضت Google واجهة دردشة تجريبية لـ Med-PaLM 2 حيث يمكن للمستخدم الاختيار من بين مجموعة متنوعة من المشكلات الطبية لاستكشافها ، بما في ذلك حالات مثل “سلس البول” و “فقدان التوازن” و “الحاد التهاب البنكرياس “.

أدى اختيار أحد الشروط إلى إنشاء وصف من نموذج الذكاء الاصطناعي إلى جانب نتائج التقييم ، مع تصنيفات لمعايير مثل “يعكس الإجماع السريري والعلمي” و “الاستدعاء الصحيح للمعرفة”. تعرض الواجهة أيضًا وصفًا حقيقيًا للطبيب للمسألة للمقارنة بالإجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

في مايو ، في مؤتمر مطوري I / O السنوي للشركة ، أعلنت Google أنها كانت تستكشف قدرات Med-PaLM 2 لاستخلاص المعلومات من كل من الصور والنصوص ، مما يسمح للمختبرين بالمساعدة في تفسير المعلومات من الأشعة السينية وتصوير الثدي بالأشعة السينية لتحسين حالة المريض يومًا ما. النتائج. “يرجى تقديم تقرير لتلخيص الأشعة السينية التالية على الصدر” ، اقرأ إحدى المطالبات من واجهة Med-PaLM 2 التجريبية التي شاهدتها Bloomberg.

على الرغم من أنه قد لا يعمل كما هو معلن عنه في بيئة سريرية حقيقية ، إلا أن استجابة الذكاء الاصطناعي بدت مقنعة وشاملة. وأضافت أن “حقول الرئة خالية من الاندماج أو الوذمة ، أما المنصف فغير ملحوظ”. “الصورة الظلية للقلب ضمن الحدود الطبيعية للحجم ، ولا يلاحظ أي انصباب أو استرواح صدري ، ولا توجد كسور مزاحة واضحة.”

اقرأ أكثر: الصين تطلق أول نظام تشغيل كمبيوتر مفتوح المصدر لتقليل الاعتماد على التكنولوجيا الأمريكية

شارك المقال
اترك تعليقك