قامت شركة OpenAI الناشئة في مجال الذكاء الاصطناعي بإثارة مولد فيديو الذكاء الاصطناعي الجديد، Sora، على وسائل التواصل الاجتماعي في الأسابيع الأخيرة. وفي الأسبوع الماضي، كشفت أنها أعطت أيضًا الممثلين والمخرجين في هوليوود نظرة أولية على التكنولوجيا – وفرصة لتجربتها – قبل إطلاق Sora علنًا.
نشرت OpenAI منشورًا على مدونة يوم 24 مارس بعنوان انطباعات Sora الأولى، يعرض العمل الذي أنتجه العديد من الاستوديوهات والمخرجين الإبداعيين باستخدام مولد الفيديو.
يتوقع بعض خبراء الإعلام أن سورا سيكون مدمرًا للغاية لصناعة السينما الإبداعية.
وتحدثت الجزيرة مع أحد المسؤولين التنفيذيين الذي يعمل في هوليوود، والذي طلب منا عدم الكشف عن هويته نظرا لحساسية الموضوع. عندما سُئل عن رد فعله الأولي عندما رأى قدرة سورا للمرة الأولى، قال: “كان رد فعلي تجاه سورا مثل أي شخص آخر – لقد اصطدم فكي بالأرض. كان الأمر كما لو كنا نرى قاتلنا، لكنها كانت جميلة في نفس الوقت. فقط مثير للإعجاب ومرعب على الفور.
لقد شعر البعض في الصناعة بالفعل بالهزات التي سببها سورا.
في مقابلة مع هوليوود ريبورتر في فبراير، صرح الممثل والمخرج ومالك الاستوديو تايلر بيري أنه سيعلق توسعة الاستوديو التي تبلغ تكلفتها 800 مليون دولار في أتلانتا بعد رؤية قدرة سورا على إنتاج الفيديو.
وأضاف: “لذلك أنا قلق للغاية من فقدان الكثير من الوظائف في المستقبل القريب. أنا حقا أشعر بذلك بقوة”.
ما هو سورا؟
Sora هو نموذج الذكاء الاصطناعي المولد لتحويل النص إلى فيديو من OpenAI. على غرار ChatGPT، يمكنك إدخال مطالبة نصية ولكن بدلاً من إنشاء إجابات للأسئلة أو المطالبات في شكل نصي، سيقوم Sora بإنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة.
يمكن مشاهدة مثال فيديو لقدرات Sora، والذي تم إصداره بواسطة Open AI، أدناه:
- مثال موجه: “فيلم دعائي يعرض مغامرات رجل الفضاء البالغ من العمر 30 عامًا والذي يرتدي خوذة دراجة نارية من الصوف الأحمر، والسماء الزرقاء، والصحراء المالحة، بأسلوب سينمائي، تم تصويره على فيلم 35 ملم، بألوان زاهية.”
كما نشر Sam Altman، الرئيس التنفيذي لشركة OpenAI، عدة أمثلة على حساب X الخاص به، بما في ذلك ما يلي:
- مثال موجه: “جلسة طهي تعليمية لطبق جنوكتشي محلي الصنع تستضيفه إحدى الجدات المؤثرة على وسائل التواصل الاجتماعي في مطبخ ريفي توسكاني مع إضاءة سينمائية.”
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— سام التمان (@ سما) 15 فبراير 2024
سورا بعيدة عن الكمال. إذا نظرت عن كثب إلى فيديو “جلسة الطبخ التعليمية”، فإن الملعقة في اليد اليمنى تختفي بعد توقف “الجدة” عن الخلط. على الرغم من كونها واقعية للغاية، إلا أن القدرة على اكتشاف المنتجات المزيفة لا تزال موجودة في بعض مقاطع الفيديو التي ينتجها سورا.
أثار هذا سؤالًا آخر حول مدى نجاح منتج مثل هذا في الصناعة.
صرح مصدرنا المطلع في هوليوود بما يلي: “سوف نخرج على الجانب الآخر أكبر وأفضل لأن البشر سيكونون قد اكتشفوا مكانهم على قمة التكنولوجيا التي من الواضح أنها أقوى مما يمكننا تخيله حاليًا. لكن الرغبة في التمثيل، والكتابة، والتوجيه، والتأليف، والتعاون، وما إلى ذلك، هي رغبة فطرية عميقة لدى البشر. لن يذهب إلى أي مكان. فهل هذا سيء بالنسبة للبشر في هذه الصناعة؟ الجواب هو لا، ثم نعم، ثم لا. هل هو جيد للصناعة نفسها؟ نعم.
كيف يعمل سورا؟
كما هو الحال مع ChatGPT، يكتب المستخدمون أمرًا نصيًا أو سؤالاً أو مطالبة ويستجيب الذكاء الاصطناعي – في حالة Sora، بتسلسلات فيديو تم إنشاؤها.
للقيام بذلك، يستخدم Sora مزيجًا من التعلم الآلي ومعالجة اللغة الطبيعية (NLP) لإنشاء تسلسل فيديو. البرمجة اللغوية العصبية (NLP) هي شكل من أشكال الذكاء الاصطناعي الذي يفهم التفاعل بين أجهزة الكمبيوتر واللغة البشرية. يسمح التعلم الآلي لـ Sora بالتحسن بمرور الوقت مع تحسين استجاباته من خلال الأنماط والملاحظات.
يستخدم سورا “رؤية الكمبيوتر” لفهم وتفسير المعلومات المرئية من الصور أو مقاطع الفيديو. الرؤية الحاسوبية هي إطار عمل برمجي يخبر سورا “بالتعرف” على التمثيلات المرئية للأشياء والأشخاص والبيئات في العالم الحقيقي من خلال أوصاف النص التي تتضمن اللغة المرئية. على سبيل المثال، تشير المطالبات “تتحرك القطة” أو “تحطم الأمواج في المحيط” إلى سمات وخصائص معينة. يحتاج Sora إلى هذه اللغة المرئية لتفسير مطالبة النص، ثم تقديم تصوير مرئي للكائن بدقة.
يمكن لـ Sora جمع بيانات غير كاملة أو جزئية وتحويلها إلى محتوى فيديو مفهوم يبدو حقيقيًا جدًا. يعمل Sora كأداة تكبير/تصغير فائقة القوة. يبدأ الأمر بكتل كبيرة وغير واضحة من الألوان أو الكائنات، ثم يقوم بتحسينها إلى أشكال أصغر وأكثر تحديدًا بناءً على مطالبتك.
ماذا يعني سورا بالنسبة للوظائف الإبداعية في صناعة السينما؟
لا يزال من غير الواضح ما هي المهام التي يتولىها المبدعون البشريون عادة، إن وجدت، والتي يمكن أن يتولىها سورا. إن قدرة الذكاء الاصطناعي على تكرار لقطات الكاميرا والإضاءة والشخصيات بسرعة، تفتح المجال أمام المخرجين وصانعي الأفلام. ومع ذلك، يتوقع محترفو السينما أن يحدث هذا تغييرًا جذريًا في الصناعة.
وقال أحد المطلعين على شؤون هوليوود، والذي تحدث إلى الجزيرة شريطة عدم الكشف عن هويته: “لا أرى أن هذا يمثل تهديدًا للإنتاج بقدر ما يمثل تهديدًا للطريقة التي يتم بها الإنتاج كما نعرفها حاليًا”. لقد رأينا مثل هذه الأحداث في الماضي، لا سيما في مرحلة ما بعد الإنتاج عندما بدأ الأشخاص في التحرير على أجهزة الكمبيوتر المحمولة بدلاً من مكاتب البريد الكبيرة باهظة الثمن. لقد تم القضاء على الكثير من الأشخاص في تلك الفترة الانتقالية، بينما تمكن آخرون فجأة من تحمل تكلفة محرر مناسب دون النفقات العامة التي تتطلبها دار البريد.
وعندما سُئل عن الوظائف التي يمكن استبدالها بمولدات الذكاء الاصطناعي، أضاف: “ربما يكون السؤال “من الذي سيتم استبداله” هو السؤال الخاطئ. أعتقد أن هذا هو النظام الذي سيتم التخلص منه واستبداله. وفي غضون بضع سنوات، ربما يشير مصطلح “المخرج” إلى الرجل الذي يحفز الذكاء الاصطناعي، ويتم تنفيذ الباقي رقميًا بالكامل. وإذا قبل الجمهور هذا النهج، وحقق المال، وجعل الناس يشعرون بالمشاعر الإنسانية، فستنتهي اللعبة بالنسبة لمعظمنا.
ما هي حقوق الطبع والنشر والقضايا القانونية؟
يقوم Sora بسحب المحتوى من الصور ومقاطع الفيديو الموجودة بالفعل، ثم يقوم بإعادة إنشاء مقطع فيديو بناءً على مطالبة المستخدم. من يملك بالضبط هذا الفيديو المعاد إنشاؤه؟ هل يجب دفع رسوم لكل من منشئي الصور والفيديو والشخصيات الذين اعتمد سورا على أعمالهم لإنشاء الفيديو النهائي؟ هذه هي الأسئلة التي لم تتم الإجابة عليها بشكل كامل بعد.
السبب الجذري للعديد من الأسئلة المذكورة أعلاه هو كيفية تتبع منشئ أي محتوى تم إنشاؤه، بما في ذلك الأفراد الذين تم تضمينهم في الفيديو النهائي.
وفي حديثه على قناته على موقع يوتيوب، أوضح محامي التكنولوجيا بول هاسويل: “إذا كان شخص ما يستخدم نموذجًا للذكاء الاصطناعي ثم امتص عن غير قصد بعض البيانات التي ينتهي بها الأمر إلى الظهور مثلك، فما هي حقوقك – هل يتم بالفعل إساءة استخدام بياناتك الشخصية؟ ؟ كيف يمكنك إثبات أنه تم استخدام بياناتك لإنشاء هذا التشابه؟
وأضاف: “فجأة تجد نفسك ممثلاً في مسلسل تم إنتاجه بواسطة الذكاء الاصطناعي بالكامل. قد تكون مشهورًا عالميًا، لكن لا تحصل على الفضل في ذلك. قد يكون لديك صوت صارخ وليس صوتًا عميقًا ولكن وجهك سيكون هو نفسه. على سبيل المثال، لن يكون لديك أي رصيد لأنه تم استخدامك بشكل أساسي من قبل الذكاء الاصطناعي، وتم نقلك وتقيؤك في تنسيق آخر.
هناك أيضًا اعتبارات دولية حيث أن قانون حقوق الطبع والنشر يختلف باختلاف البلد. إذا نشأ الفيديو في بلد ما وتم توزيعه في بلد آخر، فما هو قانون حقوق الطبع والنشر الذي ينطبق عليه؟
وعلى مدونته، حذر والاس كولينز، محامي الترفيه المتخصص في قانون حقوق الطبع والنشر والعلامات التجارية، من أن سورا من شأنه أن يوسع كل هذه المشاكل “بشكل كبير” وقد يؤدي حتى إلى اضطرابات اجتماعية أو أشكال أخرى من الاضطراب الاجتماعي.
“لقد عطل الذكاء الاصطناعي بالفعل قانون حقوق الطبع والنشر للمبدعين، لا سيما في مجال الموسيقى، وتحدى معايير حقوق النشر والملكية الفكرية الراسخة في عالم الترفيه. بدون وجود نوع من اللوائح المنطقية المعمول بها، يمكن أن يستخدم أكثر الأفراد حقيرًا سورا لإنشاء مقاطع فيديو يمكن أن تشوه الناس وتضللهم وتخيفهم، أو حتى التحريض على أعمال الشغب بناءً على مظهر ملفق تمامًا ولكنه واقعي تمامًا في مظهر.”
كيف سيتم البت في هذه القضايا؟
يدور جزء كبير من المناقشة القانونية المحيطة بالذكاء الاصطناعي التوليدي حول مسألة من يجب اعتباره مؤلفًا لما تولده هذه الأدوات، من حيث صلتها بـ “الاستخدام العادل”. تسمح قوانين حقوق الطبع والنشر للاستخدام العادل باستخدامات محدودة للمواد المحمية بحقوق الطبع والنشر أو بتحويل العمل المحمي بحقوق الطبع والنشر إلى عمل مختلف.
في الوقت الحاضر، لا توجد سابقة قانونية تغطي التطورات الحالية في مجال تحويل النص إلى فيديو. ومع ذلك، في ديسمبر من العام الماضي، رفعت صحيفة نيويورك تايمز دعوى قضائية فيدرالية ضد ChatGPT من OpenAI (أداة تحويل النص إلى نص) وCopilot من Microsoft بسبب انتهاك حقوق الطبع والنشر في المنطقة الجنوبية من نيويورك (محكمة المقاطعة الفيدرالية في مانهاتن). تزعم صحيفة التايمز أن برنامج ChatGPT الخاص بشركة OpenAI يوفر للمستخدمين نفس المحتوى الذي قدمته صحيفة التايمز بالفعل.
وقال إيان كروسبي، محامي التايمز: “يسعى المدعى عليهم إلى الاستفادة مجانًا من استثمارات التايمز الهائلة في صحافتها من خلال استخدامها لبناء منتجات بديلة دون إذن أو مقابل. هذا ليس استخدامًا عادلاً بأي مقياس”.
وفي فبراير/شباط، قدمت شركة OpenAI طلبًا لرفض قضية التايمز في المحكمة الفيدرالية.
تم رفع قضيتين أخريين لانتهاك حقوق الطبع والنشر في محكمة مانهاتن ضد OpenAI – إحداهما بواسطة The Intercept والأخرى قضية مشتركة رفعتها شركتا Raw Story وAlterNet – في فبراير.