كانت معاينة فيلم Sora وحدها كافية لإثارة حالة من الذعر لدى العديد من صانعي الأفلام حول العالم، فقد عرضت شركة OpenAI التابعة لشركة Sam Altman أحدث نموذج لتحويل النص إلى فيديو، Sora. نموذج الذكاء الاصطناعي الجديد قادر على إنشاء مقاطع فيديو عالية الدقة مدتها دقيقة واحدة...
قامت شركة OpenAI الناشئة في مجال الذكاء الاصطناعي بإثارة مولد فيديو الذكاء الاصطناعي الجديد، Sora، على وسائل التواصل الاجتماعي في الأسابيع الأخيرة. وفي الأسبوع الماضي، كشفت أنها أعطت أيضًا الممثلين والمخرجين في هوليوود نظرة أولية على التكنولوجيا - وفرصة لتجربتها - قبل إطلاق Sora علنًا.
نشرت OpenAI منشورًا على مدونة يوم 24 مارس بعنوان انطباعات Sora الأولى، يعرض العمل الذي أنتجه العديد من الاستوديوهات والمخرجين الإبداعيين باستخدام مولد الفيديو.
يتوقع بعض خبراء الإعلام أن سورا سيكون مدمرًا للغاية لصناعة السينما الإبداعية.
وتحدثت الجزيرة مع أحد المسؤولين التنفيذيين الذي يعمل في هوليوود، والذي طلب منا عدم الكشف عن هويته نظرا لحساسية الموضوع. عندما سُئل عن رد فعله الأولي عندما رأى قدرة سورا للمرة الأولى، قال: "كان رد فعلي تجاه سورا مثل أي شخص آخر - لقد اصطدم فكي بالأرض. كان الأمر كما لو كنا نرى قاتلنا، لكنها كانت جميلة في نفس الوقت. فقط مثير للإعجاب ومرعب على الفور.
لقد شعر البعض في الصناعة بالفعل بالهزات التي سببها سورا.
في مقابلة مع هوليوود ريبورتر في فبراير، صرح الممثل والمخرج ومالك الاستوديو تايلر بيري أنه سيعلق توسعة الاستوديو التي تبلغ تكلفتها 800 مليون دولار في أتلانتا بعد رؤية قدرة سورا على إنتاج الفيديو.
وأضاف: "لذلك أنا قلق للغاية من فقدان الكثير من الوظائف في المستقبل القريب. أنا حقا أشعر بذلك بقوة”.
ما هو سورا؟
Sora هو نموذج الذكاء الاصطناعي المولد لتحويل النص إلى فيديو من OpenAI. على غرار ChatGPT، يمكنك إدخال مطالبة نصية ولكن بدلاً من إنشاء إجابات للأسئلة أو المطالبات في شكل نصي، سيقوم Sora بإنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة.
يمكن مشاهدة مثال فيديو لقدرات Sora، والذي تم إصداره بواسطة Open AI، أدناه:
_ مثال للموجه: "مقطع دعائي لفيلم يعرض مغامرات رجل فضاء يبلغ من العمر 30 عامًا يرتدي خوذة دراجة نارية من الصوف الأحمر، وسماء زرقاء، وصحراء مالحة، بأسلوب سينمائي، تم تصويره على فيلم مقاس 35 مم، وألوان زاهية."
_ مثال سريع: "جلسة طهي تعليمية لطبق جنوكتشي محلي الصنع تستضيفه إحدى الجدات المؤثرة على وسائل التواصل الاجتماعي في مطبخ ريفي توسكاني مع إضاءة سينمائية."
سورا بعيدة عن الكمال. إذا نظرت عن كثب إلى فيديو "جلسة الطبخ التعليمية"، فإن الملعقة في اليد اليمنى تختفي بعد توقف "الجدة" عن الخلط. على الرغم من كونها واقعية للغاية، إلا أن القدرة على اكتشاف المنتجات المزيفة لا تزال موجودة في بعض مقاطع الفيديو التي ينتجها سورا.
أثار هذا سؤالًا آخر حول مدى نجاح منتج مثل هذا في الصناعة.
صرح مصدرنا المطلع في هوليوود بما يلي: "سوف نخرج على الجانب الآخر أكبر وأفضل لأن البشر سيكونون قد اكتشفوا مكانهم على قمة التكنولوجيا التي من الواضح أنها أقوى مما يمكننا تخيله حاليًا. لكن الرغبة في التمثيل، والكتابة، والتوجيه، والتأليف، والتعاون، وما إلى ذلك، هي رغبة فطرية عميقة لدى البشر. لن يذهب إلى أي مكان. فهل هذا سيء بالنسبة للبشر في هذه الصناعة؟ الجواب هو لا، ثم نعم، ثم لا. هل هو جيد للصناعة نفسها؟ نعم.
كيف يعمل سورا؟
كما هو الحال مع ChatGPT، يكتب المستخدمون أمرًا نصيًا أو سؤالاً أو مطالبة ويستجيب الذكاء الاصطناعي - في حالة Sora، بتسلسلات فيديو تم إنشاؤها.
للقيام بذلك، يستخدم Sora مزيجًا من التعلم الآلي ومعالجة اللغة الطبيعية (NLP) لإنشاء تسلسل فيديو. البرمجة اللغوية العصبية (NLP) هي شكل من أشكال الذكاء الاصطناعي الذي يفهم التفاعل بين أجهزة الكمبيوتر واللغة البشرية. يسمح التعلم الآلي لـ Sora بالتحسن بمرور الوقت مع تحسين استجاباته من خلال الأنماط والملاحظات.
يستخدم سورا "رؤية الكمبيوتر" لفهم وتفسير المعلومات المرئية من الصور أو مقاطع الفيديو. الرؤية الحاسوبية هي إطار عمل برمجي يخبر سورا "بالتعرف" على التمثيلات المرئية للأشياء والأشخاص والبيئات في العالم الحقيقي من خلال أوصاف النص التي تتضمن اللغة المرئية. على سبيل المثال، تشير المطالبات "تتحرك القطة" أو "تحطم الأمواج في المحيط" إلى سمات وخصائص معينة. يحتاج Sora إلى هذه اللغة المرئية لتفسير مطالبة النص، ثم تقديم تصوير مرئي للكائن بدقة.
يمكن لـ Sora جمع بيانات غير كاملة أو جزئية وتحويلها إلى محتوى فيديو مفهوم يبدو حقيقيًا جدًا. يعمل Sora كأداة تكبير/تصغير فائقة القوة. يبدأ الأمر بكتل كبيرة وغير واضحة من الألوان أو الكائنات، ثم يقوم بتحسينها إلى أشكال أصغر وأكثر تحديدًا بناءً على مطالبتك.
ماذا يعني سورا بالنسبة للوظائف الإبداعية في صناعة السينما؟
لا يزال من غير الواضح ما هي المهام التي يتولها المبدعون البشريون عادة، إن وجدت، والتي يمكن أن يتولها سورا. إن قدرة الذكاء الاصطناعي على تكرار لقطات الكاميرا والإضاءة والشخصيات بسرعة، تفتح المجال أمام المخرجين وصانعي الأفلام. ومع ذلك، يتوقع محترفو السينما أن يحدث هذا تغييرًا جذريًا في الصناعة.
وقال أحد المطلعين على شؤون هوليوود، والذي تحدث إلى الجزيرة شريطة عدم الكشف عن هويته: "لا أرى أن هذا يمثل تهديدًا للإنتاج بقدر ما يمثل تهديدًا للطريقة التي يتم بها الإنتاج كما نعرفها حاليًا". لقد رأينا مثل هذه الأحداث في الماضي، لا سيما في مرحلة ما بعد الإنتاج عندما بدأ الأشخاص في التحرير على أجهزة الكمبيوتر المحمولة بدلاً من مكاتب البريد الكبيرة باهظة الثمن. لقد تم القضاء على الكثير من الأشخاص في تلك الفترة الانتقالية، بينما تمكن آخرون فجأة من تحمل تكلفة محرر مناسب دون النفقات العامة التي تتطلبها دار البريد.
وعندما سُئل عن الوظائف التي يمكن استبدالها بمولدات الذكاء الاصطناعي، أضاف: "ربما يكون السؤال "من الذي سيتم استبداله" هو السؤال الخاطئ. أعتقد أن هذا هو النظام الذي سيتم التخلص منه واستبداله. وفي غضون بضع سنوات، ربما يشير مصطلح "المخرج" إلى الرجل الذي يحفز الذكاء الاصطناعي، ويتم تنفيذ الباقي رقميًا بالكامل. وإذا قبل الجمهور هذا النهج، وحقق المال، وجعل الناس يشعرون بالمشاعر الإنسانية، فستنتهي اللعبة بالنسبة لمعظمنا.
ما هي حقوق الطبع والنشر والقضايا القانونية؟
يقوم Sora بسحب المحتوى من الصور ومقاطع الفيديو الموجودة بالفعل، ثم يقوم بإعادة إنشاء مقطع فيديو بناءً على مطالبة المستخدم. من يملك بالضبط هذا الفيديو المعاد إنشاؤه؟ هل يجب دفع رسوم لكل من منشئي الصور والفيديو والشخصيات الذين اعتمد سورا على أعمالهم لإنشاء الفيديو النهائي؟ هذه هي الأسئلة التي لم تتم الإجابة عليها بشكل كامل بعد.
السبب الجذري للعديد من الأسئلة المذكورة أعلاه هو كيفية تتبع منشئ أي محتوى تم إنشاؤه، بما في ذلك الأفراد الذين تم تضمينهم في الفيديو النهائي.
وفي حديثه على قناته على موقع يوتيوب، أوضح محامي التكنولوجيا بول هاسويل: "إذا كان شخص ما يستخدم نموذجًا للذكاء الاصطناعي ثم امتص عن غير قصد بعض البيانات التي ينتهي بها الأمر إلى الظهور مثلك، فما هي حقوقك - هل يتم بالفعل إساءة استخدام بياناتك الشخصية؟ كيف يمكنك إثبات أنه تم استخدام بياناتك لإنشاء هذا التشابه؟
وأضاف: “فجأة تجد نفسك ممثلاً في مسلسل تم إنتاجه بواسطة الذكاء الاصطناعي بالكامل. قد تكون مشهورًا عالميًا، لكن لا تحصل على الفضل في ذلك. قد يكون لديك صوت صارخ وليس صوتًا عميقًا ولكن وجهك سيكون هو نفسه. على سبيل المثال، لن يكون لديك أي رصيد لأنه تم استخدامك بشكل أساسي من قبل الذكاء الاصطناعي، وتم نقلك وتقيؤك في تنسيق آخر.
هناك أيضًا اعتبارات دولية حيث أن قانون حقوق الطبع والنشر يختلف باختلاف البلد. إذا نشأ الفيديو في بلد ما وتم توزيعه في بلد آخر، فما هو قانون حقوق الطبع والنشر الذي ينطبق عليه؟
وعلى مدونته، حذر والاس كولينز، محامي الترفيه المتخصص في قانون حقوق الطبع والنشر والعلامات التجارية، من أن سورا من شأنه أن يوسع كل هذه المشاكل "بشكل كبير" وقد يؤدي حتى إلى اضطرابات اجتماعية أو أشكال أخرى من الاضطراب الاجتماعي.
"لقد عطل الذكاء الاصطناعي بالفعل قانون حقوق الطبع والنشر للمبدعين، لا سيما في مجال الموسيقى، وتحدى معايير حقوق النشر والملكية الفكرية الراسخة في عالم الترفيه. بدون وجود نوع من اللوائح المنطقية المعمول بها، يمكن أن يستخدم أكثر الأفراد حقيرة سورا لإنشاء مقاطع فيديو يمكن أن تشوه الناس أو تضللهم أو تخيفهم، أو حتى التحريض على أعمال الشغب بناءً على مظهر ملفق تمامًا ولكنه واقعي تمامًا في مظهر."
كيف سيتم البت في هذه القضايا؟
يدور جزء كبير من المناقشة القانونية المحيطة بالذكاء الاصطناعي التوليدي حول مسألة من يجب اعتباره مؤلفًا لما تولده هذه الأدوات، من حيث صلتها بـ "الاستخدام العادل". تسمح قوانين حقوق الطبع والنشر للاستخدام العادل باستخدامات محدودة للمواد المحمية بحقوق الطبع والنشر أو بتحويل العمل المحمي بحقوق الطبع والنشر إلى عمل مختلف.
في الوقت الحاضر، لا توجد سابقة قانونية تغطي التطورات الحالية في مجال تحويل النص إلى فيديو. ومع ذلك، في ديسمبر من العام الماضي، رفعت صحيفة نيويورك تايمز دعوى قضائية فيدرالية ضد ChatGPT من OpenAI (أداة تحويل النص إلى نص) وCopilot من Microsoft بسبب انتهاك حقوق الطبع والنشر في المنطقة الجنوبية من نيويورك (محكمة المقاطعة الفيدرالية في مانهاتن). تزعم صحيفة التايمز أن برنامج ChatGPT الخاص بشركة OpenAI يوفر للمستخدمين نفس المحتوى الذي قدمته صحيفة التايمز بالفعل.
وقال إيان كروسبي، محامي التايمز: "يسعى المدعى عليهم إلى الاستفادة مجانًا من استثمار التايمز الضخم في صحافتها من خلال استخدامها لبناء منتجات بديلة دون إذن أو مقابل. هذا ليس استخدامًا عادلاً بأي مقياس”.
وفي فبراير/شباط، قدمت شركة OpenAI طلبًا لرفض قضية التايمز في المحكمة الفيدرالية.
تم رفع قضيتين أخريين لانتهاك حقوق الطبع والنشر في محكمة مانهاتن ضد OpenAI - إحداهما بواسطة The Intercept والأخرى قضية مشتركة رفعتها شركتا Raw Story وAlterNet - في فبراير. وفقًا ما نشره بموقع "AI Jazeera English".
هل يستطيع الذكاء الاصطناعي إنهاء صناعة الأفلام؟
كانت معاينة فيلم Sora وحدها كافية لإثارة حالة من الذعر لدى العديد من صانعي الأفلام حول العالم. في وقت سابق من هذا الشهر، عرضت شركة OpenAI التابعة لشركة Sam Altman أحدث نموذج لتحويل النص إلى فيديو، Sora. نموذج الذكاء الاصطناعي الجديد قادر على إنشاء مقاطع فيديو عالية الدقة مدتها دقيقة واحدة من خلال مطالبات باللغة الطبيعية. وكما نعلم، فإن النموذج ليس في الملكية العامة بعد، ولكن OpenAI شاركت بعض مقاطع الفيديو المذهلة التي تجعل الكثيرين يتساءلون عن مستقبل صناعة الأفلام.
يبدو أن الممثل والمخرج ومالك الاستوديو البارز، تايلر بيري، من بين أولئك الذين يشعرون بالقلق إزاء إخراج سورا السينمائي الذي لا تشوبه شائبة. وفقًا لتقرير في The Hollywood Reporter، فقد ورد أن بيري قد أوقف خطته الطموحة لتوسيع الاستوديو والتي تبلغ قيمتها 800 مليون دولار بعد رؤية قدرات سورا. كما أثار المخرج ناقوس الخطر بشأن التأثير المحتمل لهذه التكنولوجيا.
ونقل عن بيري قوله: "إن إخبارك بأنه قادر على القيام بكل هذه الأشياء هو شيء واحد، ولكن رؤية القدرات في الواقع، كان أمرًا مذهلاً". وبحسب ما ورد، كان بيري يخطط لإجراء توسعة هائلة في الاستوديو الخاص به في أتلانتا. كان من الممكن أن يحتوي هذا على 12 مسرحًا صوتيًا على مساحة 330 فدانًا. ويبدو أن خططه لن تنجح الآن، خاصة بعد أن أثار سورا ضجة على الإنترنت.
نموذج OpenAI قادر على إنتاج مقاطع فيديو بجودة المقاطع الدعائية ببضع كلمات فقط. في حين أن هذا قد يُنظر إليه على أنه تهديد، إلا أن هناك العديد من صانعي الأفلام والأعضاء في مجتمع الذكاء الاصطناعي الذين يرون أن سورا يمثل قفزة هائلة إلى الأمام وخطوة مهمة للذكاء الاصطناعي التوليدي. تتوافق مقاطع الفيديو التي أنشأها Sora مع الشخصيات والخلفيات والحركات مع إعدادات تفصيلية وكاميرات متعددة.
من المهم أن تتذكر أن سورا غير قادر على إنتاج أفلام روائية طويلة. إن فكرة أن شيئًا مثل سورا سيؤدي إلى الهلاك لصناعتي التلفزيون والسينما، حتى الآن، لا أساس لها من الصحة. في الوقت الحالي، يجب أن تتطور التكنولوجيا بشكل كبير قبل أن تسمح لأي شخص وكل شخص بأن يصبح مديرًا بمساعدة المطالبات. يمكن أن يكون هذا قفزة عملاقة في التكنولوجيا. بناءً على التقارير، يقترح الخبراء أنه لا داعي للقلق لأن تكامل الذكاء الاصطناعي قد يساعد في تحسين بعض الصناعات، وجلب المزيد من المواهب المبتكرة، وقد يؤدي إلى إمكانيات جديدة لصناعات السينما والتلفزيون حول العالم.
كحرفة، يتطلب إنتاج الأفلام الجمع بين التجارب العاطفية والحكايات الفردية. إنه تعاون بين العديد من المخرجين وكتاب السيناريو والممثلين والعديد من الفنانين الآخرين. يتم تحقيق الفيلم من خلال الجهود المشتركة لمختلف الأطراف. سورا أو أي نموذج آخر للذكاء الاصطناعي، في هذه المرحلة، غير قادر على تقليد هذا النوع من المساعي الإبداعية التعاونية.
قد يبدو نموذج OpenAI الجديد بمثابة إشارة إلى التغيير في معايير الإنتاج الحالية، وقد يؤثر حتى على بعض الوظائف. ومع ذلك، تمامًا مثلما لم يحل اختراع التصوير الفوتوغرافي محل الرسم أو استحوذت الطباعة على الأدب، فإن سورا سوف يتحسن بمرور الوقت من خلال التحديثات والترقيات. ومع ذلك، فإنه قد لا يهدد صناعة الأفلام لأن الإبداع الذي ينفرد به البشر يقع في مركزها. بحسب موقع "Indian Express".
اضف تعليق