يشير مصطلح الموثوقية (Reliability) في البحث النفسي إلى اتساق دراسة بحثية معينة أو اختبار قياس معين. مثلاً، إذا كان الشخص يزن نفسه خلال اليوم، فإنه يتوقع أن يرى قراءة مماثلة. فالمقاييس التي تقيس الوزن بشكل مختلف في كل مرة ستكون قليلة الفائدة. وبشكل مماثل أيضاً يمكن تطبيق ذلك على شريط القياس الذي يقيس البوصة (Inches) بشكل مختلف في كل مرة يتم استخدامه. حينها لن يعتبر موثوقاً.

إذا تم تكرار نتائج الأبحاث باستمرار، فيمكن الاعتماد عليها. ويمكن استخدام معامل الارتباط (Correlation coefficient) لتقييم درجة الموثوقية. أي إذا كان الاختبار موثوقًا، فيجب أن تظهر علاقة ارتباط إيجابية عالية.

وبالطبع، من غير المرجح أن يتم الحصول على نفس النتائج بالضبط في كل مرة يتغير فيها المشاركون والحالات، لكن علاقة الارتباط الإيجابية القوية بين نتائج الاختبار نفسه تشير إلى الموثوقية.

هناك نوعان من الموثوقية، الداخلية والخارجية: تقوم الموثوقية الداخلية بتقييم اتساق النتائج عبر العناصر داخل الاختبار. بينما تشير الموثوقية الخارجية إلى المدى الذي يختلف فيه القياس من استخدام لآخر.

تقييم الاعتمادية

تقيم الموثوقية الداخلية بطريقة تجزئة النصف، فيما تقيم الخارجية بطريقة الاختبار واعادة الاختبار، وطريقة الموثوقية ما بين المقيمين (inter rater)

طريقة تجزئة النصف

تقوم طريقة تجزئة النصف بتقييم الاتساق الداخلي للاختبار، مثل الاختبارات النفسية والاستبيانات. أي أنها تقيس مدى مساهمة جميع أجزاء الاختبار بالتساوي في ما يتم قياسه.

يتم ذلك بمقارنة نتائج نصف الاختبار مع النتائج من النصف الآخر. يمكن تجزئة الاختبار إلى النصف بعدة طرق، مثلاً، النصف الأول والنصف الثاني، أو بالأرقام الفردية والزوجية. إذا كان نصفي الاختبار يقدمان نتائج مماثلة، فإن هذا يشير إلى أن الاختبار له مصداقية داخلية.

يمكن تحسين موثوقية الاختبار من خلال استخدام هذه الطريقة. على سبيل المثال، يجب إزالة أو إعادة كتابة أي عناصر في نصفي اختبار منفصل ذات ارتباط منخفض (مثلاً r = .25).

طريقة تجزئة النصف هي طريقة سريعة وسهلة لتحقيق الموثوقية. ومع ذلك، لا يمكن أن تكون فعالة إلا مع الاستبيانات الكبيرة التي تقيس جميع الأسئلة التي تمتلك نفس البنية. هذا يعني أنه لن يكون مناسباً للاختبارات التي تقيس أشكالاً مختلفة.

على سبيل المثال، يحتوي “اختبار مينيسوتا المتعدد الأدوار للشخصية” على مقاييس فرعية لقياس سلوكيات مختلفة مثل الاكتئاب، الفصام، الانطواء الاجتماعي. لذا فإن طريقة تجزئة النصف ليست طريقة مناسبة لتقييم الموثوقية في اختبار الشخصية هذا.

الاختبار وإعادة الاختبار

تقوم طريقة اختبار وإعادة الاختبار بتقييم الاتساق الخارجي للاختبار. وتشمل أمثلة الاختبارات المناسبة الاستبيانات والاختبارات النفسية. فهي تقيس استقرار الاختبار بمرور الوقت.

يتضمن التقييم النموذجي إعطاء المشاركين نفس الاختبار في مناسبتين منفصلتين. إذا تم الحصول على نفس النتائج أو نتائج مماثلة يتم إنشاء موثوقية خارجية. تتمثل عيوب طريقة إعادة الاختبار في أنه يستغرق وقتًا طويلًا للحصول على النتائج.

بيك وآخرون. (1996) درس استجابات 26 مريضا خارجيا على جلستين منفصلتين للعلاج بفارق أسبوع، وجدوا علاقة بين .93 مما يدل على موثوقية عالية لاختبار بيك الاكتئاب (BDI).

هذا مثال على أهمية الموثوقية في البحث النفسي، إذا لم يكن الأمر متعلقًا بمصداقية مثل هذه الاختبارات، فقد لا يتم تشخيص بعض الأشخاص بنجاح باضطرابات كالاكتئاب مثلاً، وبالتالي لن يتم إعطاؤهم العلاج المناسب.

توقيت الاختبار مهم. إذا كانت المدة مختصرة، فقد يتذكر المشاركون المعلومات من الاختبار الأول الذي قد يؤدي إلى تحيز النتائج. أما إذا كانت المدة طويلة جدًا، فمن الممكن أن يكون المشاركون قد تغيروا بطريقة مهمة قد تؤدي أيضًا إلى تحيز النتائج.

الموثوقية ما بين المقيّمين

تقوم طريقة اختبار وإعادة الاختبار بتقييم الاتساق الخارجي للاختبار. يشير هذا إلى الدرجة التي يعطيها مختلف المقيمون تقديرات ثابتة لنفس السلوك. يمكن استخدام موثوقية ما بين المقيمين لإجراء المقابلات.

لاحظ، يمكن أن يطلق عليها أيضًا الموثوقية ما بين المراقبين عند الإشارة إلى الأبحاث القائمة على الملاحظة. هنا الباحث عندما يلاحظ نفس السلوك بشكل مستقل (لتجنب التحيز) ويقوم بمقارنة بياناتهم. إذا كانت البيانات متشابهة، فيمكن الاعتماد عليها.

في الحالات التي لا ترتبط فيها علامات المراقبين بدرجة كبيرة ، يمكن تحسين الموثوقية من خلال:

– تدريب المراقبين على تقنيات المراقبة المستخدمة والتأكد من أن الجميع يتفق معهم.

– ضمان تحديد وتعريف فئات السلوك بشكل موضوعي.

على سبيل المثال، إذا كان اثنان من الباحثين يلاحظان “السلوك العدواني” للأطفال في الحضانة، فإن كلاهما لديه رأي شخصي خاص به فيما يتعلق بما يتضمنه العدوان. في هذا السيناريو، من غير المرجح أن يسجلوا السلوك العدواني كما هو، فالبيانات ستكون غير موثوقة.

بينما عندما يتم تحديد فئات السلوك العدواني، فإن ذلك سيكون أكثر موضوعية ويسهل تحديد متى يحدث سلوك معين.

على سبيل المثال، بينما يكون “السلوك العدواني” غير موضوعي وغير محدد، فإن “الدفع” يكون موضوعياً ومحدد. وهكذا يمكن للباحثين أن يحسبوا ببساطة عدد المرات التي يدفع فيها الأطفال بعضهم البعض خلال فترة زمنية معينة.

McLeod, S. A. (2007). What is reliability?. Retrieved from https://www.simplypsychology.org/reliability.html