الارتباط الشرطي الاستثابي، وهو نمطٌ من التعلُّم تتأثَّر فيه قوة السلوك أو تكراره بنتائجه، مثل المكافأة أو العِقاب، ويتم التحكم في السلوك من خلال سوابقَ تسمَّى «المثيرات التمييزية»، التي تعمل كإشارةٍ إلى تلك النتائج. ينص قانونُ الأثر الذي وضعه ثورندايك على أن الاستجابات التي تنتج تأثيرًا مُرضيًا...
المنظِّرون السلوكيُّون وحدَّدوا ثلاثة أنواعٍ رئيسية من التعلُّم. الأول هو «الارتباط الشرطي الكلاسيكي»، وهو التعلُّم الذي يعتمد على الارتباط بين الأحداث، مثل الشعور بالجوع عند سماع جرس العشاء؛ لأنك أصبحت تَربِط بينه وبين مواعيد الوجبات. والثاني هو «الارتباط الشرطي الاستثابي»، وهو التعلُّم الذي يعتمد على نتائج السلوك؛ ومن ثَم تؤدي النتائج الإيجابية إلى تَكرار السلوك، بينما تؤدي العواقبُ السلبية إلى التقليل من تَكرار السلوك. ومن الأمثلة على ذلك تعلُّم عدم لمس الأشياء الساخنة لأنها تؤلم، والعمل سعيًا إلى كسبِ المال. الشكل الثالث والأخير للتعلُّم، هو «التعلُّم القائم على الملاحظة»؛ أي التعلُّم من خلال مشاهدة الآخرين، مثل تعلُّم استخدام لعبة كمبيوتر من خلال مشاهدة شخصٍ آخرَ يلعبها.
الارتباط الشرطي الاستثابي
رأى بعضُ علماء النفس، مثل بورس فريدريك سكينر، أن الارتباط الشرطي الكلاسيكي مفرطٌ في التبسيط، بحيث لا يمكن أن يكون تفسيرًا كاملًا لكل عمليات التعلُّم. كانت النتيجة تطويرَ نظرية «الارتباط الشرطي الاستثابي»، والمعروفة أيضًا باسم «الارتباط الشرطي الإجرائي» أو «التعلُّم الإجرائي».
استندت نظريةُ التعلُّم هذه إلى «قانون الأثر» الذي وضعه إدوارد ثورندايك في عام ١٩٢٧، والذي اقترحه بعد ملاحظاتٍ للقطط التي تحاول الهروبَ من صندوق متاهة. كي تتمكَّن من الهروب، كان على القطة أن تضغط على مقبض. اكتُشِف أنه مع المحاولات المتكررة، ستتمكَّن القطة من الهروب بسرعة أكبر، حيث تكون وتيرة المحاولات غير الفعَّالة أقلَّ تكرارًا، وتكون وتيرة المحاولات الفعَّالة أكثرَ تكرارًا. في النهاية ستذهب القطة مباشرةً إلى المقبض. وهكذا تكون القطة قد تعلَّمت كيفية الخروج من المتاهة.
وهذا مثالٌ على الارتباط الشرطي الاستثابي، وهو نمطٌ من التعلُّم تتأثَّر فيه قوة السلوك أو تكراره بنتائجه، مثل المكافأة أو العِقاب، ويتم التحكم في السلوك من خلال سوابقَ تسمَّى «المثيرات التمييزية»، التي تعمل كإشارةٍ إلى تلك النتائج. ينص قانونُ الأثر الذي وضعه ثورندايك على أن الاستجابات التي تنتج تأثيرًا مُرضيًا (أو التي تتجنَّب مصدرًا للإزعاج) في موقف معيَّن؛ يصبح احتمال حدوثها مرةً أخرى في تلك الحالة أكبر، والاستجابات التي لها تأثير مزعج يصبح احتمال حدوثها مرةً أخرى في تلك الحالة أقل. باختصار، بعض النتائج يقوِّي السلوك، وبعضها الآخر يضعِفه. حدَّد سكينر نوعَيْن من العناصر الاستثابية يؤثِّران على السلوك:
- الاستجابات التعزيزية أو المعزِّزات: هي استجاباتٌ من البيئة تزيد من احتمالية تكرار السلوك.
- الاستجابات العقابية: هي استجاباتٌ من البيئة تقلِّل من احتمالية تكرار السلوك.
استخدمَ سكينر غرفة ارتباط شرطي استثابي، تُعرف باسم «صندوق سكينر»، لإظهار كيف يعمل العقاب والتعزيز الإيجابي والسلبي. إنَّ صندوق سكينر هو صندوق متاهة يمكن فيه تعريضُ حيواناتٍ، مثل الحَمَام أو الفئران، لمثيراتٍ يتمُّ التحكُّم فيها بعناية. احتوى الصندوق على مقبضٍ يُخرِج طعامًا إذا ضغط عليه الحيوان. وبينما يتحرَّك الحيوان داخل الصندوق، فإنه في النهاية سيضغط على المقبض بمحض المصادفة، وسرعان ما تعلَّمت الحيوانات الضغطَ على المقبض للحصول على الطعام، مما يدُل على التعزيز الإيجابي لسلوك الضغط على المقبض.
وقد أثبتَ سكينر تعزيزًا سلبيًّا من خلال تعريض الحيوان لتيارٍ كهربائيٍّ مزعج، يمكن إغلاقُه عن طريق الضغط على المقبض («تعلُّم الهروب»). مرةً أخرى، بتكرار التجارب، تعلَّمت الحيوانات الضغطَ على المقبض على الفور. ضمنت نتيجةُ نجاتهم من التيار الكهربائي أنهم سيُكرِّرون هذا الفعل. في الواقع، عندما سبق تشغيل التيار الكهربائي ظهورُ ضوء، تعلَّمت الحيوانات الضغطَ على المقبض لمَنْع تشغيل التيار («تعلُّم التجنُّب»). وعندما يتضمَّن التعزيز إضافةَ شيءٍ ما (مثل الطعام) إلى موقفٍ ما؛ لزيادة احتمالية حدوث السلوك (الضغط على المقبض)، فإنه يسمَّى «التعزيز الإيجابي».
التعزيز السلبي يكون عند نَزْع شيءٍ ما (التيار الكهربائي الكريه) لزيادة احتمالية حدوث السلوك.
بعض المثيرات التي تعمل معزِّزاتٍ هي بطبيعتها مُرضية («معزِّزات أولية») لأنها تلبي حاجةً ما، مثل الطعام أو الماء. على النقيض من ذلك، فالمعزِّزات الثانوية هي أشياءُ مُرضية فقط لارتباطها بمعزِّز أساسي. على سبيل المثال، يُعَد المال معززًا ثانويًّا، حيث يمكن استخدامه لشراء الأشياء التي تلبي الاحتياجات (المعزِّزات الأولية).
يعكس العقابُ التعزيزَ من خلال ما يمارسه من إضعافٍ أو تقليلٍ بقوة الاستجابة أو تكرارها، ويمكن أن يكون العقاب إيجابيًّا أو سلبيًّا أيضًا. «العقاب الإيجابي» يكون بإضافة مثيرٍ بغيضٍ لتقليل تكرار سلوكٍ ما. على سبيل المثال، توبيخ الطفل لكونه مشاكسًا. على النقيض من ذلك، فإن «العقاب السلبي» هو عند إزالة شيءٍ سارٍّ، مثل «وقت اللعب»، لتثبيط سلوكٍ غيرِ مرغوبٍ فيه.
وعلى الرغم من هذه الاختلافات المفاهيمية، فقد يكون من الصعب التمييزُ بين الاثنَين في الممارسة العملية؛ فإذا عُوقِبَ الطفلُ بالاحتجاز بسبب التحدُّث في الفصل، فهل العقاب في هذه الحالة إيجابيٌّ أو سلبيٌّ؟ إنه إيجابي لأنَّ مثيرًا غيرَ سارٍّ أُضيفَ (الحرمان من وقت الراحة)، ولكنه سلبي أيضًا لأن إمكانية الحصول على مثيرٍ سارٍّ (أيًّا كان ما يمكن للطفل فِعله إذا لم يُحرَم من وقت الراحة) قد انتُزِعَت.
بشكلٍ عام، الأكثر فعالية هو محاولةُ تعزيز السلوك المرغوب فيه بدلًا من معاقبة السلوك غيرِ المرغوب فيه. ومع ذلك، قد يكون هذا صعبًا، وهذا لأنه في كثيرٍ من الأحيان على المستوى العملي، ما نريده أكثرَ هو تقليل تكرار السلوك غير المرغوب فيه (مثل العدوانية)، ويمكن أن يكون من الصعب معرفةُ كيفية مكافأة غياب هذا السلوك بشكلٍ فعَّال، لا سيَّما إذا كان سلوكًا وتيرة تكراره قليلة. علاوة على ذلك، هناك بعضُ الأدلة على أن تقديم المكافآت الخارجية يمكن أن يقوِّض الدافعَ الداخلي. ولذا، فإن مكافأة الطفل على تناول الخضراوات قد يقلِّل في الواقع من حبِّه لها، حتى لو نتجَ عن ذلك زيادةُ تناوله لها. (انظر الجدول ١-١).
يؤثِّر أيضًا المعدَّل الذي تُمنَح به المكافأة على مدى قوَّتها كمعزِّز. تُقاس قوة التعزيز بطريقتَين. أولًا: «معدَّل الاستجابة»، وهو معدَّل تكرار السلوك؛ أي عدد المرات التي يضغط فيها الفأر على المقبض؛ وثانيًا: «معدَّل الانطفاء»، وهو المدة التي يستغرقها الفأر للتوقُّف عن الضغط على المقبض، بمجرَّد توقُّف خروج الطعام.
جدول ١-١: أنواع العقاب والتعزيز
|
الإيجابي (إضافة مثير) |
السلبي (إزالة مثير) |
التعزيز (يزيد من احتمالية تكرار السلوك) |
مثال: مكافأة الأطفال على انتظامهم في الحضور إلى المدرسة بالمال. |
مثال: تغريم الوالدَيْن اللذَيْن لا يحضُر أطفالُهما بشكل منتظم. |
العقاب (يقلِّل من احتمالية تكرار السلوك) |
مثال: تكليف البعض بكتابة بعض الفقرات عدة مرات؛ عقابًا لهم على تحدُّثهم أثناء الدرس. |
مثال: حرمان البعض من وقت الراحة؛ عقابًا لهم على تحدُّثهم أثناء الدرس. |
تُعرَف طريقةُ تنفيذ التعزيز وفقًا لجدول زمني محدَّد أو قاعدة بعينها باسم «نظام التعزيز»، وتَرِد أنواعه الرئيسية في الجدول ١-٢. كما ترون بالجدول أدناه، فمن المفارقة أن قوة ظهور السلوك لا تزيد كلما ضمنت الحصول على مكافأة بشكلٍ مستمر. بل غالبًا ما تكون أقوى المعزِّزات هي تلك التي يكون الحصول عليها أقلَّ توقعًا، مما قد يساعد في توضيح الإغراء الذي تشكِّله المقامرة أو شراء تذاكر اليانصيب.
جدول ١-٢: أنظمة التعزيز
نظام التعزيز |
المكافأة |
معدَّل الاستجابة |
معدل الانطفاء |
مستمر |
مكافأة في كل مرة يظهر فيها السلوك (مثل جرعات يتحكَّم فيها المريض من مسكِّنات الألم). |
منخفض — لا يتطلب جهدًا كبيرًا حيث يمكنك الحصول على المكافأة وقتما تشاء. |
سريع — سرعان ما يتضح أن الفعل لم يَعُد ينتج عنه المكافأة. |
فترة ثابتة |
مكافأة بعد فترة زمنية ثابتة شريطة إظهار السلوك مرةً واحدة على الأقل خلال ذلك الوقت (على سبيل المثال، جرعات من مسكِّنات الألم في أوقات محدَّدة). |
متوسط — يوجد بعض الدافعية للعمل من أجل الحصول على المكافأة. |
متوسط — يستحق مواصلة المحاولة لفترةٍ، لمعرفةِ إن كان سيصبح فَعَّالًا مرة أخرى كما كان، أم لا. |
نسبة ثابتة |
مكافأة بعد حدوث السلوك لعدد محدَّد من المرات (على سبيل المثال، مكافأة الطفل ببعض الحلوى عند حصوله على خمس نجوم، في مخطَّط النجوم التشجيعي الخاص به). |
معدَّل الاستجابة مرتفع؛ لأن المكافآت تزيد بزيادة الجهد المبذول. |
معدل الانطفاء متوسط، حيث يستغرق الأمر بعضَ الوقت لإدراك أن القواعد قد تغيَّرت. |
نسبة متغيرة |
يكافأ السلوك بعد عدد غير متوقَّع من المرات (مثل شراء تذكرة يانصيب أو المقامرة). |
معدَّل الاستجابة مرتفع؛ لأنك لا تعرف مقدار الجهد المطلوب منك للحصول على المكافأة. |
معدل الانطفاء بطيء؛ لأنه من الصعب معرفة أن المكافأة لم تَعُد متوفرة إذا كانت دائمًا غير متوقعة. |
فترة متغيرة |
مكافأة بعد فترةٍ زمنيةٍ متغيرة، شريطة إظهار السلوك مرةً واحدةً على الأقل خلال ذلك الوقت (مثل التحقُّق من رسائل بريدك الإلكتروني). |
معدَّل الاستجابة مرتفع؛ لأنك لا تعرف مقدار الجهد المطلوب منك، للحصول على المكافأة. |
معدَّل الانطفاء بطيء؛ لأنه من الصعب معرفة أن المكافأة لم تَعُد متوفرةً إذا كانت دائمًا غير متوقعة. |
استُخدِمت مبادئُ الارتباط الشرطي الاستثابي للتأثير على السلوك في العديد من السياقات. غالبًا ما تكون مثل هذه التدخُّلات شكلًا من أشكال «برنامج تعديل السلوك» الذي يستخدم أنظمةَ التعزيز و/أو العقاب، من أجل زيادة تكرار السلوكيات المرغوبة، و/أو تقليل تكرار السلوكيات غير المرغوب فيها. هذا أمرٌ شائع في سياقات الفصول الدراسية؛ حيث يتمُّ تقديم الثناء أو المكافآت على العمل أو السلوك الجيد، والعقاب على العمل أو السلوك السيئ. تُظهِر الأبحاث أن مكافأة المدخلات أكثرُ فعاليةً من مكافأة المخرجات؛ ومن ثَم فمكافأة الأطفال بالمال مقابل المذاكرة (المدخلات) تؤدِّي إلى حصولهم على درجاتِ اختبارٍ أفضلَ من مكافأتهم مباشرةً على تحقيق درجاتٍ أفضل في الاختبار (المخرجات). تشير مثل هذه الأبحاث إلى أن أنظمةَ «الدفع مقابل الأداء» للمعلِّمين، التي يتم فيها مكافأتهم بناءً على درجات اختبارات طلابهم (المخرجات)، قد لا تكون الاستراتيجية الأكثرَ فاعلية.
غالبًا ما تُستخدَم مبادئ الارتباط الشرطي الاستثابي في إدارة سلوك الطفل، مع استخدام مخطَّطات النجوم التشجيعية والمكافآت للسلوك الجيد، واستراتيجية قضاء بعض الوقت في مكان مخصَّص للعقاب للسلوك غير المرغوب فيه. استخُدمت تدخُّلات مماثلة لتعزيز الحضور في المدرسة، على سبيل المثال، من خلال مكافأة الحضور المنتظم بالمال أو قسائم الشراء، أو بتغريم الوالدَيْن على عدم حضور طفلهما بشكلٍ منتظمٍ في المدرسة. قد تَستخدم مؤسسة بأكملها مثلَ هذه الاستراتيجية. يستخدم بعضُ مستشفيات الطب النفسي أو المرافق التعليمية نظامًا يسمَّى «الاقتصاد الرمزي»؛ حيث يحصل الفرد على نقاطٍ أو ما شابه للقيام بالسلوك المرغوبِ فيه، ويمكن أن يُستبدَل بها مكافآت مثل الحصول على وجباتٍ خفيفة أو امتيازاتٍ بعينها أو القيام بأنشطة محدَّدة. غالبًا ما تعتمد السجون أيضًا على مثل هذه المبادئ، بتقديم مكافآتٍ على السلوك الجيد، أو غياب السلوك السيئ، مثل امتيازات متعلِّقة بمشاهدة التلفزيون، وعقاب السلوك غير المرغوب فيه بالاحتجاز الفردي. في الواقع، يمكن القول إن المجتمع القائم على استخدام النقود هو اقتصادٌ رمزي كبير؛ حيث يكافأ السلوك المرغوب (العمل) برموز تشجيع (المال) تتيح الحصولَ على المكافآت.
لقد غطَّى هذا الفصل أولَ شكلَيْن من أشكال التعلُّم، ألا وهما الارتباط الشرطي الكلاسيكي والارتباط الشرطي الاستثابي. ويُعتقَد أن الشكل الثالث من التعلُّم، وهو التعلُّم القائم على الملاحظة، يتضمَّن المزيد من الوساطة المعرفية، وهذا ما سنتناوله في الفصل الثاني.
اضف تعليق