أرى أن فكرة البحث جيدة، وعلى الرغم من أن ترتيب التحديات على نحوٍ يُمكِّن برنامج ذكاء اصطناعي من تناقُل المهارات عبر المهمات المختلفة ليس بأمر جديد، فإن استخلاص المعلومات من روبوت وإدراجها في روبوت آخر بهدف تناقُل المهارات هو أمرٌ لم يخطر ببالي من قبل...
بقلم ماثيو هيوستون
يشيع استخدام الروبوتات من شتى الأشكال والأحجام في بيئات عمل متنوعة، بدءًا من المصانع ووصولًا إلى غرف العمليات الجراحية، ويعتمد الكثير من هذه الروبوتات على اكتساب مهارات جديدة عن طريق المحاولة والخطأ عبر تقنية التعلم الآلي، لكن ثمة وسيلة جديدة قد تساعد على تناقُل تلك المهارات بين الروبوتات مختلفة الشكل بحيث لا تضطر إلى تَعلُّم المهمات من الصفر في كل مرة، "يحمل هذا الأمر قدرًا من الأهمية من الناحية العملية، ولكن عند النظر إليه بعين الباحث، أراه يجسِّد قضيةً أساسيةً من الممتع دراستها"، هكذا كان تعليق سنجيو ليو، عالِم الحاسوب في جامعة كارنيجي ميلون، والمؤلف الرئيسي للبحث الذي طُرِح الصيف الماضي في أثناء فعاليات المؤتمر الدولي للتعلم الآلي.
وعلى سبيل التوضيح لفكرة تناقُل المهارات بين الروبوتات، دعنا نفترض أن لديك روبوتًا له ذراع مزودة بيد شبه بشرية، وأنك قد دربْتَ أصابع يد الروبوت الخمس على التقاط مطرقة والدق بها على وتد من أجل تثبيته في لوح، ثم أردت بعد ذلك من روبوت تتكون قبضة يده من أصبعين أداء المهمة نفسها، هذا ما أراد العلماء تحقيقه عندما ابتكروا سلسلةً من الروبوتات الافتراضية التي تصل بين هذين الروبوتين ويتبدل شكلها ببطء من الشكل الأصلي إلى الشكل الجديد، وفي أثناء هذه العملية يتدرب كل روبوت وسيط على المهمة المنوطة به، مُدخِلًا ما يحتاج من تعديلات على شبكة عصبية اصطناعية بحيث يصل بها إلى أدنى معدل من النجاح في أداء المهمة، ثم تُنقَل شفرة المتحكم إلى الروبوت التالي في السلسلة.
وللانتقال بين المصدر الافتراضي والروبوتات المستهدفة، ابتكر الفريق "شجرة حركية" مشتركة، وهي عبارة عن مجموعة من العُقَد التي تمثل أجزاء الذراع ويتصل بعضها ببعضٍ عبر روابط تمثل المفاصل، ولكي يتمكن الفريق من نقل مهارات الدق بالمطرقة إلى الروبوت ذي الأصبعين، عدَّلوا أحجام وأوزان العُقَد الخاصة بثلاثٍ من الأصابع كي تصبح صفرًا، ومع كل روبوت وسيط، كانت أحجام الأصابع وأوزانها تقل بنسبة ضئيلة، وكان على الشبكة المتحكمة فيها تَعلُّم كيفية التأقلم مع هذا التغير، وقد أدخل الباحثون أيضًا تعديلاتٍ طفيفةً على وسيلة التدريب التي كانوا يستخدمونها، بما يضمن ألا تكون النقلات التطورية بين الروبوتات أكبر أو أصغر من اللازم.
وتجدر الإشارة إلى أن نظام جامعة كارنيجي ميلون -الذي أُطلِق عليه اسم «ريفولفر» REvolveR (اختصارًا لعبارة Robot-Evolve-Robot)- قد تفوَّق على وسائل التدريب المرجعية المعروفة، مثل تعليم الروبوت المستهدف من الصفر، ولكي يحقق الباحثون نسبة نجاح تصل إلى 90% في تعليم الروبوت ذي القبضة ثنائية الإصبع مهمة المطرقة (ومهمات أخرى مثل تحريك كرة وفتح باب ضمن مزيد من التجارب) باستخدام أفضل وسيلة بديلة ممكنة، تطلَّب الأمر تنفيذ محاولات تزيد عما يتطلبه نظام «ريفولفر» بنسبة تتراوح من 29% إلى 108%، وذلك على الرغم من أن تلك الوسيلة البديلة تطلبت المزيد من التقييمات التدريبية المعلوماتية، وفي التجارب اللاحقة، اختبر الباحثون العملية التي ابتكروها على أنواع أخرى من الروبوتات الافتراضية، فأضافوا -على سبيل المثال- أجزاءً تمثل ساقًا جديدةً إلى روبوت شبيه بالعنكبوت وجعلوه يتعلم كيفية الزحف من جديد.
وتعليقًا على هذا يقول فيتالي كورين، عالِم الحاسوب في جامعة أكسفورد، الذي يدرس علم الروبوتات والتعلم الآلي ولم يشارك في البحث: "أرى أن فكرة البحث جيدة"، وعلى الرغم من أن ترتيب التحديات على نحوٍ يُمكِّن برنامج ذكاء اصطناعي من تناقُل المهارات عبر المهمات المختلفة ليس بأمر جديد، فإن "استخلاص المعلومات من روبوت وإدراجها في روبوت آخر بهدف تناقُل المهارات هو أمرٌ لم يخطر ببالي من قبل"، كما يضيف.
اضف تعليق