q
هل من المخيف أن تمتلك الآلة مخيلة وأن تكون مبتكرة؟ بالطبع، ولكن ينطبق ذلك على أي تقنية. لا يوجد شر جوهري حيال التطورات التكنولوجية، بل يتعلق الأمر بطريقة استخدامها. فطالما حافظنا على إطار آمن ومرن للابتكار، بإمكاننا الاستفادة من الفرص الهائلة خاصة في مجال الأعمال...
بقلم: ثيودوروس إفجنيو

أثبتت تقنية deepfakes للتلاعب بمقاطع الفيديو أن آلة التعلم والذكاء الاصطناعي قد اتقنوا فنون الوهم. فهل أصبحوا مستعدين لمساعدة عملك على الابتكار؟

احتلت ابتسامة الموناليزا فكر العلماء ورواد الفن لأجيال، اكتسب اللغز مؤخراً بعداً جديداً بفضل الرسوم المتحركة الرقمية التي ابتكرها الباحثون في الذكاء الاصطناعي بشركة سامسونج.

تمت مشاهدة مقطع الفيديو الذي عرضته سامسونج على يوتيوب ملايين المرات، ظهرت فيه الموناليزا بشكل واقعي تتحدث وتتحرك. لكن ذلك لم يكن بفضل رسومات حاسوبية هوليودية لشخصيات ابتكرها الإنسان وتحكم بها. بل تم ابتكارها 100% بواسطة الذكاء الاصطناعي، وعلى الأخص، شبكة عصبية مؤهلة من خلال بنك من الصور للتعرف على العلاقات بين معالم الوجه من خلال العديد من التعابير وتكرارها. حركات الوجه في الموناليزا مستمدة من مقاطع فيديو لثلاثة مواضيع إنسانية.

إن تعاون سامسونج مع ليوناردو دافنشي هو التعاون الأخير في سلسلة الأخبار الزائفة لتقنية "deepfakes": وهي مقاطع فيديو مذهلة ولربما مخيفة، يتم خلالها التلاعب بوجوه شخصيات شهيرة بواسطة التكنولوجيا والقيام بشتى الأمور غير المتوقعة. تناول هذا الأسلوب حتى الآن باراك أوباما ساخراً من دونالد ترامب، والأسطورة سلفادور دالي (الذي مات في 1989) يلتقط صورة سلفي مع رواد المتحف، وغيرهم العديد. بالطبع تمتع مبتكري deepfake وخوارزمياته برفاهية التغطية الكبيرة لمواضيعهم. فمن خلال تزييف الموناليزا، استطاعت سامسونج بث الحياة بصورة واحدة ثابتة، وصوة مرسومة. فهو نوع من التسلية ولكن قد يترتب عنه تداعيات خطيرة.

آلية عمل deepfakes

في المرحلة الأولية، الكمبيوترات التي تقدر وظائف المسارات في الصورة من المفروض أن تقوم بذلك عندما يتغير وجه الإنسان أو يتناوب على القيام بتعابير. يتم تقدير تلك الوظائف بالاستناد إلى حركات وجه الإنسان. نجح الكمبيوتر بتعلم شكل وجه الإنسان وحركته. ومن ثم يقوم بنقل تلك المعرفة لأي صورة، كما حدث في الموناليزا. بذلك ينجح بتوليد أرقام جديدة، مثل قيم البيكسل من 0 وحتى 255، والتي ينتج عند تقديمها مقاطع الفيديو deepfake.

كما دهشنا عند رؤيتنا للموناليزا تتحدث، فإن الفكرة بمعنى أوسع، تشبه فكرة الحاسبة الرقمية التي ظهرت في أوائل الستينات، فالسلائف الرقمية موجودة منذ قرون. تستخدم الآلة الحاسبة مبادئ وضعها مطوروها وبيانات مدخلة يضعها المستخدم للحصول على نتيجة جديدة (على سبيل المثال الإجابة على عملية حسابية). ذلك ما تقوم به بعض الخوارزميات أيضا: تستخدم المبادئ التي برمجها أحدهم لتوليد أرقام جديدة، وبهذه الحالة تكون القيم الجديدة للبيكسل. مع ذلك يكمن الاختلاف الرئيسي بكون آلة التعلم الإحصائية ترفع الاحتمالات من خلال تمكين الكمبيوتر من كتابة الرمز الخاص به – والذي قد يكون من مبادئه- وبشكل عام الدالة غير الخطية – التي تولد تلقائياً الأرقام وتنجز مهام مثل إنشاء مقاطع فيديو من صورة واحدة للموناليزا.

وهكذا يتم ترقية الكمبيوتر من مساعد يتبع مبادئ كتبها الإنسان إلى متدرب يقوم بتدريب نفسه على ترجمة النص أو التعرف على الأشياء داخل الصور أو ممارسة الألعاب، أو ابتكار حركات وجه واقعية بالاستناد إلى أنماط جمعها من الفيديو وصور ثابتة. لذا فإن تمسية Deepfake خاطئة. وبالمعنى الدقيق للكلمة، المعلومات المرئية بتلك الفيديوهات ليست زائفة بإمكاننا القول صورة "غير واضحة"، أو حتى توصية من أمازون ونتفليكس، أو نتاج أي من الخوارزميات الأخرى.

كانت أبحاث سابقة، كنت محظوظاً لمشاركتي فيها، نوعاً ما بمثابة تمهيد لما حدث في deepfakes. ففي منتصف التسعينات في معهد ماساتشوستس عندما كان التعلم الآلي الحديث في بداياته، اكتشف وزميلي إمكانية استخدام مصفوفة الجبر لاستقراء الصور بأبعاد ثنائية وثلاثية من زوج من صورة ثابتة. كنا قادرين على جعل صورنا تتحرك وتتحدث كما هو الحال في deepfakes وإن لم تكن جودة الصورة عالية لخداع أي شخص.

الذكاء الاصطناعي AI = الخيال الاصطناعي

للوهلة الأولى يبدو أن الباحثين بشركة سامسونج قد أنجزوا المستحيل. من الناحية الفنية قد تعتقد أن هناك حاجة لصورتين على الأقل من أجل إنجاز العمل وعمل كيان بأبعاد ثلاثية – ففي نهاية الأمر نحتاج إلى عينين اثنتين. بالعودة إلى تسعينات القرن الماضي، حاولنا جعل صورة مثل الموناليزا كشخصية متحدثة، لكن مع عدم وجود صورة ثانية لم نكن قادرين على القيام بذلك. إذا ما كانت الآلة تستطيع اليوم خلق عالم ثلاثي الأبعاد فقط من صورة واحدة لطائرة، فهل نستطيع إثبات أن الذكاء الاصطناعي يمتلك شيئاً أقرب إلى الإبداع البشري والخيال؟

لحظة، ألا تعتقد أننا قمنا بتفسير طريقة عمل آلة التعلم في صنع الأخبار الزائفة؟ النموذج الجديد للموناليزا لم يكن عبارة عن مخيلة لفنان. ببساطة تعلم الكمبيوتر آلية حركة الوجه، ونقل تلك المعرفة إلى تحفة دافنشي وتلاعب بالصورة بناءً عليه. فما هو الاختلاف الكبير والواضح بين مهارة فنان كبير ومهارة استثنائية لروبوت مع الصور؟

ما هو الخيال، في حال لم يكن توليد بيانات جديدة؟

لذا من أجل حسم الجدل، لنفترض أن الكمبيوترات الذاتية التعلم تمتلك القدرة على التخيل، بحسب التعريف أعلاه. فمن المنطقي أنه في ظل منح الوقت الكافي والتطورات التكنولوجية، قد تستطيع التفكير بابتكارات ومنتجات جديدة، حتى من دون أي تدخل بشري. قد تستطيع التعلم من مجال وتطبيقه على مجالات أخرى جديدة لخلق ابتكارات. قد يكون ذلك بمثابة نقلة نوعية لقطاع الأعمال والاقتصاد والمجتمع. بإمكاني القول أن ذلك بدء فعلاً يحصل. بيعت العام المنصرم لوحة مرسومة بواسطة الذكاء الاصطناعي في مزاد ومعرض كريستي بما يقارب النصف مليون دولار. هناك عدد لا يحصى من الأمثلة الأخرى، ولكن من الضروري أن ندرك أنه لا يوجد سؤال أبيض أو أسود.

على سبيل المثال، عندما يقوم الهاتف الذكي بشكل تلقائي بتحسين الصور، أو إعطاء مقترحات أثناء الكتابة، آلا يعتبر ذلك نوع من التعاون الإبداعي بينك وبين الجهاز؟ أو لنعتبر أن الخوارزميات التي تعطي مقترحات في يوتيوب ونيتفليكس أكثر تأثيراً من أي ناقد صحفي. من الجنون التفكير بأن أولئك القيمين الافتراضيين، الذين يتمتعون بمعرفة غير محدودة بتفضيلات الجمهور والعديد من المنتجات، قد يقوموا بأحد الأيام بتطوير منتجاتهم الخاصة وكتابة السيناريوهات وليس فقط تقديم اقتراحات.

العمل في الطليعة

هل من المخيف أن تمتلك الآلة مخيلة وأن تكون مبتكرة؟ بالطبع، ولكن ينطبق ذلك على أي تقنية. لا يوجد شر جوهري حيال التطورات التكنولوجية، بل يتعلق الأمر بطريقة استخدامها. فطالما حافظنا على إطار آمن ومرن للابتكار، بإمكاننا الاستفادة من الفرص الهائلة خاصة في مجال الأعمال. فعلى سبيل المثال، بإمكان مراكز البحوث والتطوير والتصنيع، تحقيق استفادة قصوى من قدرة الذكار الاصطناعي على التصور بأبعاد ثلاثية. يساعد الذكاء الاصطناعي أيضاً الباحثين في حل المشاكل العلمية الهامة المتعلقة بفهمنا للبيولوجيا والبيئة وغيرهم.

تلتزم كلية إنسياد بجعل الذكاء الاصطناعي كقوة للخير. يضم بحثي الأخير على مجموعات متنوعة من الأشخاص: ليس فقط مهندسين وعلماء كمبيوتر وقادة ورجال أعمال، بل أيضاً مشرعين وفلاسفة وعلماء اجتماعي واقتصاديين...الخ. فنحن بحاجة إلى وجهات نظر واسعة، للنظر بالوعود والتهديدات التي تحملها التكنولوجيا الجديدة لا سيما الذكاء الاصطناعي.

لحسن الحظ، نصادف اليوم المزيد والمزيد من التنفيذيين الذي يستوعبون ذلك. فقد أدركوا أن تقدير الآثار الهائلة المترتبة عن الثورة التكنولوجية المستمرة، يقع على عاتق جميع المستويات الوظيفية والاختصاصات داخل المؤسسة. وفي حال استمرار هذا النهج، ستصبح ميزات كما في فيسبوك "الواجهة الأخلاقية للذكاء الاصطناعي" وأصوات المساهمين حول التكنولوجيا المثيرة للجدل (كما حدث مؤخراً مع أمازون) هي المعيار بكل القطاعات، وسيصبح العالم أفضل بالنسبة لها. هناك الكثير على المحك، والكثير من الأمور المهمة والمثيرة التي يتوجب علينا القيام بها.

* ثيودوروس إفجنيو، أستاذ في علوم القرار وإدارة التكنولوجيا بكلية إنسياد، والمدير الأكاديمي لمختبر إنسياد الالكتروني.
https://knowledge-arabia.insead.edu

...........................
* الآراء الواردة لا تعبر بالضرورة عن رأي شبكة النبأ المعلوماتية

اضف تعليق