من البرمجة إلى المحادثة: هل يستطيع الذكاء الاصطناعي تعليم الروبوتات اللغة العربية؟ – أخبار

فريق التحرير

كان حبش سابقًا عالم أبحاث في مركز أنظمة التعلم الحاسوبية بجامعة كولومبيا قبل انضمامه إلى جامعة نيويورك أبوظبي

إن ظهور أنظمة الذكاء الاصطناعي المتقدمة (AI)، مثل ChatGPT، يحمل القدرة على تغيير عالمنا بالكامل. ومع ذلك، فإن غالبية هذه المنصات تعمل في المقام الأول باللغة الإنجليزية، مما يترك لغات مثل اللغة العربية تواجه انتكاسات بسبب محدودية البيانات عبر الإنترنت. في عالم يعتمد بشكل متزايد على الذكاء الاصطناعي، يجد نزار حبش، عالم الكمبيوتر المتخصص في معالجة اللغات الطبيعية واللغويات الحاسوبية، نفسه عند مفترق طرق فريد من نوعه. من خلال الأبحاث المكثفة التي تشمل الترجمة الآلية، والتحليل المورفولوجي، والنمذجة الحسابية للغة العربية ولهجاتها، يقدم عمل حبش رؤى حول التحديات والفرص التي يوفرها بناء أنظمة الذكاء الاصطناعي باللغة العربية، أو بعبارات أبسط، “تعليم اللغة العربية للروبوتات”.

“اللغة العربية هي إحدى أهم اللغات على مستوى العالم. وهي تحتل المرتبة الأولى من حيث عدد الأشخاص الذين يستخدمونها، سواء للحياة اليومية أو للأغراض الدينية فقط. ويضيف: “إنها لغة مهمة حملت المعرفة على مدى فترة طويلة من تاريخ البشرية، وحافظت عليها بشكل أساسي”.

ويشير حبش، أستاذ علوم الكمبيوتر في جامعة نيويورك أبوظبي، إلى الحاجة الملحة لتطوير أنظمة تعلم آلي أكثر تطوراً ومجهزة بشكل أفضل لمعالجة الفروق الثقافية الدقيقة المضمنة في اللغات المختلفة. “اليوم، عندما نقوم بتقييم الموارد المتاحة للغة العربية وأنظمة الذكاء الاصطناعي المستخدمة حاليًا، نجد أنها لا تتناسب مع مستوى التعقيد الذي تحمله اللغة.”

يقول حبش، الذي ينحدر في الأصل من فلسطين: “كوني متحدثًا أصليًا للغة العربية، فقد كنت على دراية بتعقيداتها منذ سن مبكرة جدًا – بدءًا من لهجاتها المختلفة في جميع أنحاء العالم العربي وحتى المعايير التي كان علي الالتزام بها طوال حياتي”. تعليم. لقد فكرت كثيرًا في كيفية استخدام اللغة العربية كوسيلة لهويتنا ومعرفتنا وتواصلنا، خاصة في عصر الذكاء الاصطناعي. ونحن نواجه أمثلة عديدة للمشاكل في هذا الصدد.

تحديات البيانات

هل يمكن للقيود المفروضة على البيانات المتاحة عبر الإنترنت لتعلم اللغة العربية أن تؤثر على تطوير وأداء أنظمة الذكاء الاصطناعي؟ وبحسب حبش، فإن الفكرة الحالية التي حققت نجاحًا كبيرًا في مجال الذكاء الاصطناعي هي “ببساطة أنه كلما زادت البيانات كلما كان ذلك أفضل”. “هذا ليس التحدي الأكبر، ولكن بالنسبة لبعض الناس، قد ينظر إليه على أنه التحدي الوحيد. المشكلة في هذه الفكرة هي أنك ستصل في النهاية إلى النقطة التي لا يوجد فيها المزيد من البيانات التي يتم إنشاؤها بشكل طبيعي، وفي اللحظة التي تبدأ فيها في توليد بيانات اصطناعية وتدريب أنظمة الذكاء الاصطناعي على نفسها، فإن الأمر يشبه إنشاء الوحوش،» يقول حبش، الذي كان كان سابقاً عالم أبحاث في مركز أنظمة التعلم الحاسوبية بجامعة كولومبيا قبل الانضمام إلى جامعة نيويورك أبوظبي.

يستخدم الذكاء الاصطناعي حلقات ردود الفعل، والتي يمكن أن تتضمن أحيانًا مدخلات تحتوي على أخطاء “إبداعية”. لذا، فإن إنتاج كمية بيانات تعادل 100 مرة، يعني أن الأخطاء سيتم تضخيمها أيضًا 100 مرة، كما يوضح حبش. “عندما تتكرر الأخطاء مرارًا وتكرارًا، تصبح هي القاعدة، ومن ثم تصبح القاعدة هي نموذج التشغيل. النموذج ليس لديه مفهوم للواقع. إنها ببساطة تحاول التنبؤ بالكلمة التالية، أو ملء الفراغ، أو استخدام ما يسمى تقنيات الإخفاء لمعرفة الجزء التالي من الجملة. ويضيف: “إن الذكاء الاصطناعي رائع في ارتكاب الأخطاء بثقة”.

عند مناقشة القيود المفروضة على جمع البيانات عبر الإنترنت للغة العربية، يسلط حبش الضوء أيضًا على مخاطر التحيز الخوارزمي وعدم القدرة على فك الفروق الدقيقة النحوية المتأصلة في النص العربي، مثل غياب علامات التشكيل. علامات التشكيل، المعروفة أيضًا باسم “التشكيل” أو “الحركات” باللغة العربية، هي رموز صغيرة توضع فوق الحروف العربية أو أسفلها للإشارة إلى أصوات الحروف المتحركة والنطق والتركيبات النحوية.

تشكل هذه التعقيدات تحديات كبيرة لأنظمة الذكاء الاصطناعي التي تسعى جاهدة إلى فهم ومعالجة النص العربي بدقة. “اللغة العربية، في الاستخدام الشائع عادةً، تُكتب بدون علامات التشكيل التي تشير إلى حروف العلة. فقط حوالي 1 إلى 2% من الكلمات العربية في الصحف تحتوي فعليًا على علامة لحروف العلة، لكن القراء العرب يعرفون كيفية فهمها. إنه فهم لا واعي لدى القراء، ولا يتعين علينا التفكير فيه. ومع ذلك، قد تكون الكلمة غامضة نتيجة لذلك ويمكن أن يكون لها معاني كثيرة. يقول حبش: “لذا، عندما نقوم بتعليم الآلات، يصبح السياق مهمًا حقًا”.

ويضيف أن الجانب الرئيسي الآخر الذي يجب أخذه في الاعتبار هو اللهجات المختلفة العديدة التي تندرج تحت مظلة اللغة العربية. “حيثما توجد لهجات، هناك أيضًا اختلافات تاريخية. اللغة العربية الفصحى، والعربية الفصحى القرآن، مكتوبة بطرق مختلفة قليلاً عن اللغة العربية الفصحى الحديثة. وهذا شيء آخر تتعامل معه الآلات. يمكن أن يخلط القرآن اكتب باللغة العربية الفصحى الحديثة، باللهجة المصرية، وقم بتجميع هذه الكومة معًا، الأمر الذي من شأنه أن يربك الكثير من الأشياء.”

“هناك تعقيدات مختلفة. في رأيي، بعض التحديات المثيرة للاهتمام التي لم يتم استغلالها بعد، من المحتمل أن تكون ذات صلة بالتحيز الخوارزمي،” يقول حبش.

الحساسية الثقافية والتحيزات

عندما يتعلق الأمر بأنظمة الذكاء الاصطناعي المتقدمة مثل ChatGPT، هناك أنواع مختلفة من التحيزات التي يجب على المرء أن يأخذها في الاعتبار. يوضح حبش: “أحدهما هو تحيز المحتوى والآخر هو تحيز الشكل النحوي، لكن كلاهما مترابطان”. “يرتبط تحيز المحتوى بنوع الأفكار حول العالم التي من المحتمل أن يولدها النظام في النماذج التوليدية. كما هو الحال مع الذكاء الاصطناعي كان العالم توبي والش قد قال سابقًا: “اللغة سياسية. هناك دائمًا تحيز متأصل”. وإلى حد ما، أنا أتفق مع هذا. على سبيل المثال، في التقارير الصحفية التقليدية، كنا نرى دائمًا نموذج القتل، حيث يبدو أن الإسرائيليين “نُقتل دائمًا، والفلسطينيون دائمًا “يموتون”، فمن المستحيل أن نقتل. هذه الأنواع من التحيزات يمكن أن تحدث أيضًا في اللغة العربية”.

ويضيف مستشهدًا بمثال أحدث من قيام ChatGPT بجولات على وسائل التواصل الاجتماعي، “وبالمثل، سُئل ChatGPT: “هل يستحق الفلسطينيون أن يكونوا أحرارًا؟” و”هل يستحق الإسرائيليون أن يكونوا أحراراً؟” كان الجواب بالنسبة للإسرائيليين يتعلق بما يلي: “بالطبع، الإسرائيليون بشر، وجميع البشر يستحقون الحرية”، بينما بالنسبة للفلسطينيين، كان الرد على غرار “إن مسألة كون الفلسطينيين أحرارًا هي مسألة معقدة ذات معنى”. آراء كثيرة”. هناك تحيزات في كل مكان. يقول حبش: “سوف يكرر الذكاء الاصطناعي ما يتعلمه”.

ما هي الخطوات التي يمكن اتخاذها لضمان أن تكون أنظمة الذكاء الاصطناعي باللغة العربية حساسة ثقافياً وتتجنب التحيز في تفاعلاتها؟ يقول حبش: “إن التحدي الحقيقي هو معرفة كيفية جعل الآلات تصمم بشكل صحيح، ومعرفة الأشياء التي يجب أن تحظى بوزن أعلى أو أقل”.

“أحد الحلول هو إضافة المزيد من البيانات إلى أنظمة التدريب، للحصول على نتائج أفضل. ومع ذلك، يأتي هذا مع تحدياته الخاصة. والحل الآخر، وهو أكثر واعدة، هو أن الباحثين يجب أن يعملوا على تحديد المحتوى الذي يبدو بعيدًا عن الواقع. ويضيف: “التوزيع الطبيعي المتوقع”. “على سبيل المثال، إذا كان هناك الكثير من الإشارات إلى أن الأطباء رجال والممرضات نساء، فهل يمكنك بالفعل تقليل أوزان النموذج بشكل مصطنع؟ ليس عليك تغيير البيانات؛ يمكنك تغيير الطريقة التي تتعلم بها من البيانات. إذا رأينا نمطًا يبدو غريبًا فيمكننا العمل على موازنته.”

يقول حبش: “إنها حقًا مساحة جديدة ومثيرة لأننا نتعامل مع البيانات والمعلومات ويمكن التلاعب بها بطرق مختلفة”.

دور خبراء اللغة والذكاء الاصطناعي

ما هي الطرق التي يمكن لخبراء اللغة الحاسوبية، مثل حبش، المساهمة في التغلب على هذه التحديات واتخاذ خيارات تصميمية “أفضل” لضمان الحساسية الثقافية في أنظمة الذكاء الاصطناعي؟

“هذا سؤال عظيم. كصناعة، نحن نركز بشكل أكبر على كفاءة وفعالية وتصميم النموذج، وإنشاء شيء بسيط وسهل من نوع “أناقة Google”. لقد قامت Google بتبسيط كل شيء من خلال مربع بحث واحد بسيط وهو أمر جذاب جدًا للأشخاص المنشغلين بالفعل. كمية البيانات الموجودة على الويب ضخمة جدًا بشكل يبعث على السخرية. الجميع يريد الإجابة المختصرة”، يرد حبش.

في مجال خيارات التصميم لنماذج الذكاء الاصطناعي، يدعو عالم الكمبيوتر إلى البساطة دون التضحية بالمضمون، محذرًا من “الطلاقة الخادعة”. “على سبيل المثال، إذا كنت تتحدث إلى متحدث باللغة الإنجليزية يجيد النطق، فإن افتراضك الأساسي هو أن هذا الشخص يبدو جيدًا للأذن، وأنك تفهمه. من الواضح أنهم أذكياء، إذا كانوا أذكياء، فهم جيدون، وإذا كانوا جيدين، فإنهم يقولون الحقيقة. ولكن إذا كنت شخصًا فائق الذكاء ويعرف الكثير ولكن لديه صعوبة في التحدث باللغة الإنجليزية، فقد لا تفكر بنفس الطريقة”.

“الأمر نفسه ينطبق على الآلات. الطلاقة تساوي الذكاء تساوي الحقيقة، وهو أمر غير صحيح منطقيًا. لذلك، نحن لا نتعامل مع شيء لم نتعامل معه من قبل ولكن الشيء الوحيد هو الحجم وسهولة الوصول إليه باستخدام أنظمة الذكاء الاصطناعي المتقدمة. يقول حبش: “إنها أعلى بكثير”.

ومن ثم، فإن مخاطر التخلي عن الفاعلية البشرية لصالح الذكاء الاصطناعي شديدة للغاية، و”إذا اعتمدنا كثيرًا على الذكاء الاصطناعي لاتخاذ القرارات نيابة عنا ولكي يكون صوتنا، فإننا نتخلى عن شيء ما في إنسانيتنا وذكائنا وضميرنا وربما عواطفنا”. “المسؤولية، التي لن تأخذنا بعيدًا”، يقول حبش، مشددًا على الدور الذي لا يمكن الاستغناء عنه للحكم الإنساني والتعاطف والمسؤولية الأخلاقية. “لهذا السبب أعتقد أنه من المهم للغاية الاستمرار في تثقيف البشر.”

[email protected]

شارك المقال
اترك تعليقك