هل التعزيز الإيجابي لسكينر هو علم زائف؟

التعزيز الايجابي

التعزيز الإيجابي  (positive reinforcement) هو وصف قدمه عالم النفس السلوكي الأمريكي بورهوس سكينر لأي نتائج إيجابية أو ممتعة تأتي بعد إستجابة معينة بغرض زيادة حدوث تلك الإستجابة وتكرارها في المستقبل. ويعتمد التعزيز الإيجابي على نظام المكافأة في الدماغ والذي ينظم السلوك من خلال التأثيرات الممتعة والسارة. الإجازات والمكافآت والمديح في نظام العمل كُلها أمثلة على التعزيز الإيجابي، وكذلك الحال في النظام التعليمي[1].

إستند سكينر في إثباته للتعزيز الإيجابي على تجربة لفأر جائع في صندوق يحتوي على زر مرتبط بعتلة تقوم بوضع الطعام له، بإستمرار ومع التجارب تمكن الفأر من ضغط الزر للحصول على الطعام فرأى سكينر في ذلك دليلاً على التعزيز الإيجابي. الفيديو أدناه من مسلسل بيغ بانغ ثيوري (Big bang theory) يوضح مثالاً على التعزيز الإيجابي، حيث تقوم الفتاة (بيني – Penny) بسلوك معين يراه الفتى على اليمين (شيلدون – Sheldon) على أنه غير صائب فتصحح سلوكها فيقدم لها الشوكولاته، ثم يستغرق ليونارد وشيلدون بالكلام عن التعزيز الإيجابي بشكل فكاهي.

منذ ذلك الحين إلى الوقت الذي تراجع فيه علم النفس السلوكي وتوجهت الجهود بشكل أكبر نحو علم النفس المعرفي، فقد أصبحت نظرية سكينر إحدى السمات البارزة لهذا التخصص اللامع في علم النفس. في هذا المقال نناقش ورقة الدكتور غونار نيوكويست (Gunnar Newquist) التي ناقش فيها أن التعزيز الإيجابي هو علم زائف[2]. علماً أن نيوكويست هو مختص في علم الأعصاب.

يقول نيوكويست “إحدى شواخص العلم الحديث هي قابلية التخطئة (falsifiability) التي توضح لنا إذا ما كان هناك طريقة لإثبات أننا على خطأ. ففي الطب مثلاً يُمكننا أن نخضع العلاج للقياس مع تأثير العلاج بالوهم (Placebo)”. لكن نيوكويست يرى بعض التجاهل لقابلية التخطئة في العلوم العصبية، وأن هناك معضلة في تجربة سكينر الشهيرة.

يرى نيوكويست أولاً أن تجربة سكينر ليست الأولى من نوعها والأفضل، بل أن تجارب بافلوف تسبقها حيث يتم عرض محفزين على العنصر الخاضع للتجربة، ومن ثم يتم عرض أحد المحفزين على حدة ليتم التأكد فيما إذا كان التعلم قد حدث فعلاً أم لا. ما يحدث في تجربة سكينر هو أن هناك زر واحد ليتم ضغطه لتأتي العتلة بالطعام. في الإصدار البافلوفي من التجربة ينبغي أن لا يكون هناك زر أساساً، بل يجب أن يترك للفأر أن يقوم بالعديد من الأفعال ثم يتم تقديم الطعام له بناءاً على سلوكه، ثم يُلاحظ إذا ما كان الفأر قد تعلم ذلك وسيقوم بالفعل نفسه مع التكرار أم لا؟ تماماً مثلما يحدث مع البلاسيبو في إختبارات الأدوية. والدواء الذي لا ينجح في القياس مع البلاسيبو فهو ليس دواءاً بل هو زيف، والعملية برمتها ستكون علماً زائفاً.

لكن ماذا عن التعزيز الإيجابي كله، إنه أيضاً غير قابل للتخطئة ولا يتضمن وصفاً لما قام بتكرار السلوك مرة بعد مرة، هل هو التعزيز؟ ما هو التعزيز؟ الأمر يدور في منطق دائري، والمنطق الدائري يعني أن العملية هي علم زائف. إذا كان التحفيز (stimulus) هو المعزز (reinforcer) فكيف نعلم بأن التحفيز كان هو المعزز؟ لأنه زاد من حدوث السلوك، فما الذي زاد من السلوك؟ إنه التعزيز. المنطق الدائري واضح جداً.

لكن المشكلة لا تتوقف هنا بالنسبة لنيوكويست، فالتعزيز هو أساس لكثير من نظريات المنفعة الإقتصادية وكلها تستخدم هذا المنطق الدائري ذاته، حيث يختار الشخص سلوكيات معينة لأنها ستزيد من المنفعة، أي زيادة التعزيز، الخالي من الشروحات وغير الخاضع لقابلية التخطئة. فهل نحن بحاجة لهذه النظرية الآن؟ لدينا أنظمة لتعليم الكلاب، وبرامجيات عملاقة للذكاء الاصطناعي تعمل في مجال العلوم العصبية وتقدم لنا قوانين واضحة للتعلم. اليوم علينا أن نقرر إذا ما كنا سنخضع جميع قواعدنا لقابلية التخطئة أم لا؟

هل نتوقف عند رأي نيوكويست؟

في الحقيقة إن نيوكويست يركز نقده على فقرات محددة وهي نقد تجربة سكينر أولاً ومن ثم على عدم وجود شروحات معمقة للتعزيز الإيجابي تجعله مرتبطاً بعلم الأعصاب وأيضاً على المنطق الدائري الذي يجعل للتعزيز الإيجابي قيمة وصفية لا تفسيرية لما يجري في سلوكنا. بالنسبة للفقرة الأولى فإن التعزيز الإيجابي لا يتوقف عند سكينر وتجاربه فهناك العديد من التجارب والأبحاث الأخرى اللاحقة، قد لا يكون التعزيز الإيجابي بتلك القوة لكن لا يُمكن إسقاطه كلياً بهذه السهولة وهو مدعوم بالكثير من الدراسات في مختلف نواحي الحياة. ربما ينتهي الأمر بالتعزيز الإيجابي يوماً ما مع آليات عديدة ومتنوعة لفهم ما نصفه اليوم بالتعزيز الإيجابي وكما وصف نيوكويست، لكن ليس من السهولة أن تحذف جميع التطبيقات والتجارب المرتبطة بالتعزيز الايجابي بهذا الشكل الآن. يُمكن أن يتفكك التعزيز الإيجابي وأن يتشعب إلى مفاهيم أكثر وقد يلغى بعض ما نعتبره تعزيزاً إيجابياً لكن إذا ما انتهى هذا المصطلح يوماً ما فهو لن ينتهي بتفنيد التجربة التي يبتدئ بها.

المصادر:

[1]  BRIAN FRANCIS REDMOND, “Reinforcement Theory”, wikispaces.psu.edu, Sep 19, 2016

[2] Newquist, Gunnar. “Is Positive Reinforcement Pseudoscience?.”

تدقيق: رمزي الحكمي

عدد القراءات (180)

التعليقات

التعليقات

About Omar 168 Articles

مهتم بعلم النفس والعلوم الاجتماعية والتقنيات واللغويات يمكن التواصل معي عبر البريد الالكتروني:
omar [at] real-sciences.com

Be the first to comment

Leave a Reply

Your email address will not be published.


*