يشهد كل أسبوع تقريبًا إطلاق أداة ذكاء اصطناعي جديدة تبدو أكثر إبهارًا من سابقتها. وقد بدأ الباحثون يتهافتون على تجربتها. فاليوم، صارت ترسانة الأدوات المتاحة لهم من نماذج الذكاء الاصطناعي التوليدي، أكبر من أي وقت مضى، ليختاروا من بينها، سواء لكتابة المسودات البحثية أو الأكواد البرمجية أو استحداث الفرضيات...
يشهد كل أسبوع تقريبًا إطلاق أداة ذكاء اصطناعي جديدة تبدو أكثر إبهارًا من سابقتها. وقد بدأ الباحثون يتهافتون على تجربتها. فاليوم، صارت ترسانة الأدوات المتاحة لهم من نماذج الذكاء الاصطناعي التوليدي، أكبر من أي وقت مضى، ليختاروا من بينها، سواء لكتابة المسودات البحثية أو الأكواد البرمجية أو استحداث الفرضيات.
وتتباين نماذج القوالب اللغوية الكبيرة تلك في المهام التي تلائمها. وبعضها يتوفر في هيئة روبوتات دردشة مجانية، في حين يُتاح بعضها الآخر في هيئة واجهة تطبيقات برمجية غير مجانية، ما يسمح بإدماجها في برمجيات أخرى. وعدد قليل من هذه النماذج يمكن أيضًا تنزيله، للسماح للباحثين بتصميم نماذج توائم خصيصًا أغراضهم.
لكن كاري رايت، اختصاصي علم البيانات من «مركز فريد هاتشينسون لأبحاث السرطان»، في مدينة سياتل في ولاية واشنطن الأمريكية يحذر من أن هذه النماذج رغم استجابتها للأوامرعلى نحو شبيه بالبشر، تظل معرضة بدرجة كبيرة للخطأ، إلى حد لا يسمح باستخدامها دون إشراف بشري.
إذن أي من هذه النماذج يُعد الأنسب للمهمة التي تنشدها؟ في هذا التحقيق الإخباري، يُطلع باحثون دورية Nature على تفضيلاتهم لمساعدة من هم بحاجة إلى الإرشاد في هذا الإطار.
«أوه 3 - ميني»: نموذج التفكير المنطقي
في عام 2022، بطرح شركة «أوبن إيه آي» OpenAI، الكائن مقرها في مدينة سان فرانسيسكو بولاية كاليفورنيا الأمريكية، لروبوت الدردشة المجاني الخاص بها «تشات جي بي تي»، عرف العالم أول القوالب اللغوية الكبيرة. وقد استخدمه العلماء في المقام الأول للبحث عن المعلومات، أو كأحد أدوات المساعدة في كتابة المؤلفات البحثية، على سبيل المثال، لصوغ ملخصات أبحاثهم. لكن اليوم، بدأت النماذج الأحدث من الروبوت في توسعة مجالات استخداماته الممكنة. ففي سبتمبر الماضي، في خطوة جديدة تُعد الأكبر لشركة «أوبن إيه آي» منذ إنتاج الروبوت، أبهرت الشركة العالم بنموذجها «أوه 1» o1 الذي وصفته بأنه أحد نماذج "التفكير المنطقي"، بل وأعقبت ذلك بطرح نموذج «أوه 3» o3 الأكثر تطورًا في ديسمبر الماضي. وكلا نموذجي التفكير المنطقي أبطأ في الاستجابة للأوامر من نماذج القوالب اللغوية الكبيرة العادية، وهذا لأنهما تدربا على الإجابة عن الاستفسارات خطوة بخطوة. وساعدتهما آلية "التسلسل الفكري" تلك الرامية إلى محاكاة التفكير المنطقي عند البشر على تحقيق تفوق منقطع النظير في تحديات صعبة في مجالي العلوم والرياضيات. كما أكسبتهما براعة في عدد من المهام الفنية، مثل حل مشكلات التشفير وإعادة تنسيق البيانات.
وبعد أن أطلقت شركة صينية مغمورة ناشئة باسم «ديبسيك» Deepseek في مدينة هنجتشو الصينية نموذج تفكير منطقي منافس في العشرين من يناير الماضي، واجهت شركة «أوبن إيه آي» هذه الخطوة بإطلاق طائفة جديدة من أدوات الذكاء الاصطناعي. ومن أمثلتها، نموذج روبوت الدردشة «أوه 3- ميني» o3-mini الذي يتسم بسرعته في معالجة الأوامر، وهو نموذج تفكير منطقي متاح بالمجان لمن سجلوا اشتراكهم في خدمة الروبوت، ونموذج «ديب ريسيرش» Deep research، الذي يسمح باشتراك مدفوع بإعداد تقارير تجمع المعلومات، مع الإشارة إلى مصادرها في استشهادات بحثية من مئات المواقع، على نحو يشبه مراجعات الأدبيات البحثية. والجمع بين هذه النماذج المختلفة يتيح أداء أقوى، بحسبما يرى آندرو وايت، اختصاصي الكيمياء وخبير تقنيات الذكاء الاصطناعي لدى شركة «فيوتشر هاوس» FutureHouse، وهي شركة ناشئة في مدينة سان فرانسيسكو الأمريكية.
كذلك يخبرنا سايمون فريدر، اختصاصي علم الرياضيات والباحث في مجال الذكاء الاصطناعي من جامعة أكسفورد بالمملكة المتحدة بأن نموذج «أوه 3-ميني»، "يظهر براعة كبيرة"، فيما يتعلق بمهام مثل تحليل المفاهيم غير المألوفة في البراهين الرياضية الجديدة. لكنه يستدرك قائلًا إن حتى أبرع النماذج "لا يقترب مستواها من أن يرقى لمنافسة اختصاصيي الرياضيات".
نموذج «ديبسيك» متعدد التخصصات
طُرح الشهر الماضي، نموذج «ديبيسك - آر1» DeepSeek-R1، ويتمتع بإمكانات تضاهي ملكات نموذج الذكاء الاصطناعي «أوه1»، لكنه يتوفر من خلال واجهة تطبيقات برمجية بجزء بسيط من التكلفة التي يكبدها «أوه1». كما أنه يتميز عن نماذج شركة «أوبن إيه آي» بأنه مفتوح الأوزان، أي أنه برغم عدم الإفصاح عن البيانات التي تدرب عليها، قابل للتنزيل ويمكن لأي شخص مواءمته لأغراض مشروعه البحثي. ويصف وايت هذا النموذج قائلًا إنه "فتح الباب أمام تبني إطار عمل جديد"، يمكن فيه للمجتمعات، لا سيما تلك التي تعاني نسبيًا من شح الموارد، تصميم نماذج تفكير منطقي متخصصة.
غير أن تشغيل النموذج بكامل إمكاناته يتطلب رقائق حوسبة عالية الأداء، وهي غير متوفرة لدى الكثير من الباحثين الأكاديميين. من هنا، بدأ باحثون مثل بينيو وانج، اختصاصي علم الحاسوب من جامعة هونج كونج في مدينة شينجن الصينية في صنع نسخ منه يمكن تشغيلها وتدريبها باستخدام آلة واحدة. وشأنه شأن نموذج «أوه 1»، يتفوق نموذج «ديبسيك - آر 1» في حل المعضلات الرياضية وكتابة الأكواد البرمجية. غير أنه يبرع أيضًا في مهام أخرى، مثل وضع الفرضيات، بحسب ما يفيد وايت. والسبب أن شركة «ديبسيك» آثرت نشر بيان يوضح تفصيلًا "عمليات التفكير" التي يؤديها النموذج. وهذا، كما يوضح وايت، يعزز قدرة الباحثين على تنقيح أسئلتهم التالية للنموذج وتحسين مخرجاته في نهاية المطاف. وهذه الشفافية قد تلعب دورًا قويًا في مجال التشخيص الطبي. على سبيل المثال، يعمل وانج على مواءمة النموذج للاستخدام في تجارب تستعين بملكات التفكير المنطقي له، بهدف تصميم "سير عمل واضح ومنطقي من تقييم المريض إلى تشخيصه، وصولًا إلى التوصية بعلاج محدد".
غير أن النموذج تؤخذ عليه بعض المثالب. فعلى ما يبدو، تستغرق عملية "التفكير المنطقي" لديه أمدًا شديد الطول، ما يجعله أبطأ ويضعف من جدواه في عمليات البحث عن المعلومات أو العصف الذهني. وقد دعت مخاوف بشأن أمان البيانات التي تُلقم بها واجهته البرمجية أو روبوت الدردشة الخاص به العديد من الحكومات إلى منع العاملين في الوكالات الوطنية من استخدامه. كذلك يبدو أن شركة «ديبسيك»، مقارنة بمنافسيها التجاريين، اتخذت تدابير أقل للحد من إنتاج نماذجها لمخرجات ضارة. وإضافة مرشحات للحيلولة دون إنتاج النماذج لمثل هذه المخرجات الضارة – كأن تنتج تعليمات لإنتاج الأسلحة - يكبد وقتًا وجهدًا. في هذا الصدد، يقول سايمون: "إن نقص وسائل الحماية [من هذه المخرجات] باعث على القلق"، وإن كان من المستبعد أن هذا القصور جاء متعمدًا.
أيضًا لفتت شركة «أوبن إيه آي» إلى أن شركة «ديبسيك» ربما تكون قد "استخدمت التقطير المعرفي على وجه غير مقبول" في استخلاص نماذجها من نماذج شركة «أوبن إيه آي»، مشيرة في هذا السياق إلى استخدام تقنية لتدريب النماذج على مخرجات خوارزمية أخرى، وهو سلوك لاستخدام النماذج تحظر شركة «أوبن إيه آي» استخدامه فيما يخص نماذجها.
ولم يمكن الحصول على تعقيب من شركة «ديبسيك» على هذه الاتهامات قبل وقت نشر هذا المقال.
غير أن عددًا من الباحثين يرون أن استخدام هذا النوع من التقطير المعرفي شائع، وأعربوا عن حماسهم لاستخدام نموذج «ديبسيك-آر1»، بينما تخوف آخرون من استخدام نموذج قد يخضع مستقبلًا لنزاع قضائي. فحسبما تفيد آنا كاتارينا دي ألينكار، وهي محامية متخصصة في القوانين المتعلقة بالذكاء الاصطناعي لدى شركة «إي آي تي مانيوفاكتورينج » EIT Manufacturing، ثمة احتمال لأن يُرغم العلماء الذين يستخدمون نموذج «ديبسيك-آر1» على سحب أوراقهم البحثية، إذا عُد استخدام النموذج انتهاكًا للمعايير الأخلاقية للدورية الناشرة للورقة البحثية. كذلك تلفت دي ألينكار، إلى أن المثل قد ينطبق على استخدام نماذج شركة «أوبن إيه آي»، ونماذج الشركات الأخرى الموجهة إليها اتهامات بانتهاكات لحقوق الملكية الفكرية. على سبيل المثال، زعمت مؤسسات إخبارية بأن جزء مما تنتجه من محتوى صحفي استخدمته الشركات الأخيرة لتدريب نماذج الذكاء الاصطناعي الخاصة بها دون الحصول على إذن مسبق يصرح بذلك.
«لاما»: نموذج ذكاء اصطناعي للمهام الثقيلة
لطالما كان نموذج «لاما» LIama للذكاء الاصطناعي من خيارات القوالب اللغوية الكبيرة التي يلجأ إليها الباحثون. ونُسخ هذا النموذج، وهي طائفة من النماذج مفتوحة الأوزان التي ظهرت أول ما ظهرت مع إطلاق شركة «ميتا إيه آي» Meta AI لها في مينلو بارك بولاية كاليفورنيا الأمريكية، جرى تنزيلها لأكثر من 600 مليون مرة، وذلك فقط على منصة الوصول المفتوح إلى العلوم المعروفة باسم «هاجينج فيس»Hugging Face. حول ذلك، تقول إليزابيث هامفريز، العالمة المتخصصة في تحليل البيانات من مركز «فريد هاتشينسون لأبحاث السرطان» إن إمكان تنزيل النموذج والبناء عليه "هو على الأرجح السبب الذي قاد المجتمع البحثي إلى تبني استخدامه".
فحسبما يوضح رايت، عند التعامل مع البيانات السرية أو الخاضعة لحقوق ملكية، تُعد القدرة على تشغيل نماذج القوالب اللغوية الكبيرة على الخوادم الشخصية أو خوادم المؤسسات ضرورية لتلافي إمداد مستخدمين أو مطورين آخرين بهذه البيانات الحساسة.
وقد نجح باحثون، بتطوير نماذج «لاما»، في ابتكار نماذج قوالب لغوية كبيرة تتنبأ بخواص البِنى البلورية للمواد، وتحاكي مخرجات الحواسيب الكمية. فيقول تيانلونج تشين، العالم في مجال تعلُم الآلة من جامعة كارولينا الشمالية في مدينة تشابل هيل الأمريكية، إن نموذج «لاما» اتسم بملاءمته لعمليات محاكاة الحواسيب الكمية، لأنه سهلت نسبيًا مواءمته بحيث يفهم لغة البرمجة الكمية المتخصصة.
غير أن مُستخدمي النموذج يُضطرون إلى طلب تصريح لاستخدامه، وهي مشكلة على صغرها قد تشكل عائقًا أمام استخدامه لدى البعض، بتعبير وايت. كنتيجة، صار أول خيار يلجأ إليه الباحثون اليوم في أكثر الوقت هو النماذج مفتوحة الأوزان على شاكلة نموذج «أولمو» OLMO، الذي طوره «معهد آلين للذكاء الاصطناعي» في مدينة سياتل الأمريكية، أو نموذج «كوين» Qwen الذي صممته شركة «علي بابا كلاود» Alibaba Cloud الصينية الكائنة في مدينة هنجتشو. كذلك يعد نموذج «في 3» V3، وهو نموذج عالي الكفاءة انبثق عنه نموذج «ديبسيك»، أساسًا لخروج المزيد من نماذج الذكاء الاصطناعي المنافسة في مجال العلوم.
كلود: الأقوى في البرمجة
يشير سايمون، إلى أنه في وادي السيليكون، يعتمد الكثيرون في التشفير على نموذج الذكاء الاصطناعي « كلود 3.5 سونيت» Claude 3.5 Sonnet. وهذا النموذج الذي أنتجته شركة تقنيات الذكاء الاصطناعي «أنثروبيك» Anthropic ومقرها مدينة سان فرانسيسكو الأمريكية يمكنه أيضًا تفسير البيانات البصرية مثل المخططات والأشكال البيانية، فضلًا عن النصوص. بالإضافة إلى ذلك، يسمح نمط تشغيل به بتشغيل حواسيب المستخدمين عن بعد، وهو ما قد يتيح له التحكم في برمجيات أخرى.
كما أن له جمهوره من المستخدمين الذين يستحسنون أسلوبه في صوغ المؤلفات البحثية. تعقيبًا على هذه الخاصية، تقول رايت: "عندما تتخلص بعض القوالب اللغوية الكبيرة مثل «تشات جي بي تي» من الرطانة واللغة الفنية في النص، قد تحذف دلالات هامة به. أما نموذج «كلود»، فهو أبرع في صوغ نص سلس مع الحفاظ على معانيه الأصلية، ما من شأنه أن يتيح مزية عند استخدام النموذج للشروع في صوغ طلب منحة بحثية أو إضافة توصيف شارح للأكواد البرمجية.
وبحسبما نوهت هوان صن، الباحثة في مجال الذكاء الاصطناعي من جامعة ولاية أوهايو في مدينة كولومبوس الأمريكية، أظهر «كلود 3.5» براعة في عدد من تحديات التشفير في اختبار مرجعي يرتكز على أداء عدد من المهام بالاستناد إلى بيانات، وهي مهام استُلهمت من أوراق بحثية فعلية في مجالات مثل نظم المعلومات الحيوية، وعلم الكيمياء الحاسوبي. ورغم أن استخدام نموذج «كلود 3.5 سونيت» في هيئة روبوت دردشة متاح بالمجان، شأنه في ذلك شأن نماذج الذكاء الاصطناعي لشركة «أوبن إيه آي»، لا يمكن للباحثين تحقيق الدمج والتكامل التام بينه وبين برمجياتهم إلا عبر واجهة تطبيقات برمجية غير مجانية. تعقيبًا على ذلك، تقول صن، "مع تزايد قوة أداء نماذج الذكاء الاصطناعي مفتوحة المصدر، أرى أن الأفضلية ستكون لهذه النماذج وليس لتلك مغلقة المصدر التي تستخدم واجهة تطبيقات برمجية".
«أولمو»: أفضل نموذج مفتوح المصدر
سيحتاج الباحثون الذين ينشدون فهم آليات عمل نماذج القوالب اللغوية الكبيرة إلى شفافية أكبر في تصميم هذه النماذج من تلك التي يتيحها نموذجا «لاما» و«ديبسيك». وهنا، يقول لويس تونزتال، الباحث في شركة «هاجينج فيس» إن النماذج مفتوحة المصدر، وليس مفتوحة الأوزان فقط، تأتي مرفقة ببيانات تدريب خوارزميتها، والأكواد البرمجية المستخدمة لتدريبها وتقييمها. وفي الوقت الحالي، النموذج الأفضل من هذا النوع هو « أولمو 2» OLMO 2.
ودراسة هذه النماذج تسمح للباحثين بتتبُع الانحياز في مخرجات القوالب اللغوية الكبيرة وصولًا إلى مصادره في البيانات التدريبية، فضلًا عن تحسين كفاءة النماذج من خلال بناء فهم أفضل لكيفية استدلال الخوارزميات على مخرجاتها. وفي الوقت الحالي، يتمثل العيب الأساسي للنماذج مفتوحة المصدر في أنها تتطلب عادة من الباحثين بعض الخبرة في تشغيلها، لكن مع تزايد عدد الدورات العملية المتاحة بالمجان للتدريب على استخدام هذه النماذج في أوساط المجتمع البحثي "تقل يوميًا الحواجز أمام الانضمام إلى فئة مستخدميها"، بتعبير تونزتال.
وهو ينوه إلى أن النماذج التي تدربت على مجموعات بيانات "مباحة" - يُسمح فيها باستخدام البيانات لأغراض جديدة وتعديلها، مثل نماذج مشروع شركة «هاجينج-فيس» لابتكار نسخ جديدة محاكية لـ«ديبسيك-آر1» - ربما تصبح الخيار الوحيد الآمن لاستخدامه، إذا قضت المحاكم بعدم قانونية تدريب نماذج الذكاء الاصطناعي على المحتوى المحمي بموجب حقوق ملكية.
اضف تعليق