ما هي الصلاحية (Validity) في الإحصاء؟

الصلاحية في البحوث الإحصائية

تمت صياغة مفهوم الصلاحية من قبل كيلي (1927، ص 14) الذي ذكر أن الاختبار صحيح إذا كان يقيس فعلاً ما يدعي أنه يقيس. على سبيل المثال، يجب أن يقوم اختبار الذكاء بقياس الذكاء وليس شيئًا آخر (مثل الذاكرة).

الصلاحية الداخلية والخارجية (External and Internal Validity)

يمكن التمييز بين الصلاحية الداخلية والخارجية. وهي تتعلق بتقييم صلاحية دراسة أو عملية بحثية كما يلي: تشير الصلاحية الداخلية إلى ما إذا كانت التأثيرات الملاحظة في إحدى الدراسات ناتجة عن التلاعب في المتغير المستقل (independent variable) وليس بعامل آخر. بعبارة أخرى، إن كان هناك علاقة سببية بين المتغير المستقل والتابع في الدراسة ذاتها.

يمكن تحسين الصلاحية الداخلية من خلال التحكم في المتغيرات الدخيلة، باستخدام تعليمات موحدة، وموازنة العداد (counter balancing)، وإزالة خصائص الطلب وتأثيرات المحقق (investigator effects).

تشير الصلاحية الخارجية إلى المدى الذي يمكن فيه تعميم نتائج الدراسة في بيئات أخرى (الصلاحية الإيكولوجية)، والأشخاص الآخرين (صلاحية السكان) وبمرور الوقت (الصلاحية التاريخية). يمكن تحسين الصلاحية الخارجية عن طريق تعيين التجارب في بيئة أكثر طبيعية وأخذ العينات العشوائية لاختيار المشاركين.

تقييم صلاحية الاختبار

هناك فئتان رئيسيتان للصلاحية المستخدمة في تقييم صلاحية اختبار ما (مثلاً استبيان، مقابلة، اختبار ذكاء.. وما إلى ذلك) وهما: المحتوى والمعيار.

جدول يوضح أنواع مختلفة من الصلاحية

الصلاحية القائمة على المحتوى الصلاحية القائمة على المعايير
الصلاحية الظاهرية: هل يبدو أن الاختبار يختبر ما يهدف لاختباره؟ الصلاحية المتزامنة (concurrent validity): هل يقوم الاختبار على أساس مقياس موجود؟
الصلاحية الإنشاء (construct validity) : هل يرتبط الاختبار بالمبادئ النظرية الضمنية؟ الصلاحية التنبؤية (predictive validity): هل يتنبأ الاختبار بكفاءة لاحقة بناءاً على المعايير ذات الصلة؟

الصلاحية الظاهرية (Face validity)

يعتبر أقل مقياس دقيق للصلاحية. إن الصلاحية الظاهرية تتضمن ببساطة ما إذا كان الاختبار سيقوم (بالقيمة الاسمية) بقياس ما يدعي.

الاختبارات التي يكون الغرض منها واضحًا، حتى بالنسبة للمستجيبين البسيطين، يقال أنها ذات صلاحية عالية. وعليه، فإن الاختبارات التي يكون الغرض منها غير واضح تكون صلاحيتها منخفضة (Nevo، 1985).

يتم الحصول على قياس مباشر للصلاحية الظاهرية من خلال مطالبة الناس (في الاستبيان) بتقييم صلاحية الاختبار كما يرونه. حيث يمكن المقيم استخدام مقياس مشابه للتالي. مثلاً:

1- الاختبار مناسب للغاية لغرض معين

2- الاختبار مناسب جداً لهذا الغرض

3- الاختبار مناسب

4- الاختبار غير ملائم

5- الاختبار غير ذي صلة وبالتالي غير مناسب

من المهم اختيار الأشخاص المناسبين لتقييم الاختبار (مثلاً استبيان، مقابلة، اختبار الذكاء.. وما إلى ذلك). على سبيل المثال، سيكون الأفراد الذين يجرون الاختبار بالفعل في وضع جيد للحكم على صلاحيته الظاهرية. كما يمكن للأشخاص الذين يعملون في الاختبار تقديم رأيهم (مثلاً، أرباب العمل، مديري الجامعات، أصحاب العمل). وأخيراً، يمكن للباحث استخدام أعضاء من عامة الناس ممن لديهم اهتمام بالتجربة (مثلاً، أولياء الأمور، السياسيين، المعلمين.. وما إلى ذلك).

يمكن اعتبار الصلاحية الظاهرية لاختبار ما بناءاً قوياً فقط إذا كان هناك مستوى منطقي من الاتفاق بين الذين يقيمونه.

تجدر الإشارة إلى أنه يجب تجنب المصطلح “الصلاحية الظاهرية” عندما يتم التقييم بواسطة “خبير” لأن صلاحية المحتوى (content validity) تكون أكثر ملائمة حينئذ.

إن وﺟود الصلاحية الظاهرية ﻻ ﯾﻌﻧﻲ أن اﻻﺧﺗﺑﺎر ﯾﻘﯾس ﺣﻘﺎً ﻣﺎ ﯾﻌﺗزم اﻟﺑﺎﺣث ﻗﯾﺎسه، وﻟﮐنها تعني ﻓﻘط دور الاختبار ﻓﻲ ﺣﮐم اﻟمقيميين وإن ﯾﺑدو أنه ﯾﻘوم ﺑذﻟك أم لا. وبالتالي، فإنه مقياس أساسي وصحيح للصلاحية.

إن أحد عناصر الاختبار مثلاً “لقد فكرت مؤخراً في قتل نفسي” له صلاحية ظاهرية واضحة كعنصر يقيس الإدراك الانتحاري، وقد يكون مفيداً عند قياس أعراض الاكتئاب.

ومع ذلك، فإن الآثار المترتبة على العناصر في اختبارات ذات صلاحية ظاهرية واضحة هي أنها أكثر عرضة للتحيز الاجتماعي المرغوب. فقد يتلاعب الأفراد باستجاباتهم لإنكار المشاكل أو إخفائها، أو تضخيم السلوكيات لتقديم صور إيجابية عن أنفسهم.

من الممكن أن يفتقر أحد عناصر الاختبار إلى الصلاحية الظاهرية ولكنه لا يزال يتمتع بصلاحية عامة ويقيس ما يدعي أنه يقيسه. وهذا أمر جيد لأنه يقلل من الخصائص المطلوبة ويجعل من الصعب على المستجيبين التلاعب بإجاباتهم.

على سبيل المثال، إن عنصر الاختبار”أنا أؤمن بالمجيء الثاني للمسيح” سيعاني من انعدام الصلاحية الظاهرية كمقياس للاكتئاب (حيث أن الغرض من هذا البند غير واضح).

لقد ظهر هذا البند في النسخة الأولى من اختبار مينيسوتا المتعدد الأدوار للشخصية ” The Minnesota Multiphasic Personality Inventory” وتم تحميلها على مقياس الاكتئاب. لأن معظم العينة المعيارية الأصلية للاختبار كانوا مسيحيين متدينين، فإن المسيحي غير المتدين فقط سيظن أن المسيح لن يعود. وبالتالي، بالنسبة لهذه العينة الدينية تحديداً، فإن هذا البند له صلاحية عامة، ولكن ليس له صلاحية ظاهرية.

صلاحية الإنشاء (Construct Validity)

تم اختراع مصطلح صلاحية الإنشاء من قبل كورنبول (Cornball) و ميل (Meehl) في عام 1955. ويشير هذا النوع من الصلاحية إلى المدى الذي يجسد فيه الاختبار بنية أو سمة نظرية محددة، ويتداخل مع بعض الجوانب الأخرى للصلاحية.

لا تتعلق صلاحية الإنشاء بالسؤال البسيط والواقعي حول ما إذا كان الاختبار يقيس إحدى السمات. بل يتعلق الأمر بالسؤال المعقد حول ما إذا كانت تفسيرات نقاط الاختبار متوافقة مع شبكة اسمية تتضمن مصطلحات نظرية ومراقبة (Cronbach & Meehl، 1955).

لكي نقوم باختبار صلاحية الإنشاء، يجب علينا إثبات أن الظاهرة التي يتم قياسها موجودة بالفعل. لذا، فإن صلاحية الإنشاء في اختبار الذكاء مثلاً تعتمد على نموذج أو نظرية الذكاء مثلاً. فصلاحية الإنشاء تعني إثبات قوة هذا البناء لشرح شبكة من نتائج البحوث والتنبؤ بالمزيد من العلاقات.

كلما زادت الأدلة التي يمكن للباحث أن يختبر فيها صلاحية الإنشاء كلما كان ذلك أفضل. ومع ذلك، لا توجد طريقة واحدة لتحديد صلاحية الإنشاء. بدلاً من ذلك، يتم الجمع بين طرق وأساليب مختلفة لتقديم صلاحية الإنشاء الإجمالية للاختبار. على سبيل المثال، يمكن استخدام تحليل العوامل وطرق الارتباط.

الصلاحية التزامنية (concurrent validity)

هذه هي الدرجة التي يتوافق بها الاختبار مع معيار خارجي معروف في وقت واحد (أي يحدث في نفس الوقت). إذا تم التحقق من صحة الاختبار الجديد عن طريق المقارنة مع معيار موجود حاليًا، فلدينا صلاحية متزامنة. في كثير من الأحيان، يمكن مقارنة اختبارات الذكاء أو الشخصية الجديدة مع اختبارات أقدم منها ولكن يجب أن تكون مماثلة وبمصداقية جيدة.

الصلاحية التنبؤية (predictive validity)

هذه هي الدرجة التي يتوقع بها الاختبار معيارًا سيحدث في المستقبل بدقة. على سبيل المثال، قد يتم إجراء توقع على أساس اختبار ذكاء جديد، حيث من المرجح أن يحصل ذوي الدرجات الأعلى في اختبار الذكاء هذا  على شهادات جامعية بعد عدة سنوات، لكنهم ما زالوا في سن الثانية عشر عند إجراء الاختبار. إذا تم استنباط هذا التوقع فإن الاختبار له صلاحية تنبؤية.

McLeod, S. A. (2013). What is validity?. Retrieved from https://www.simplypsychology.org/validity.html

عدد القراءات (176)

التعليقات

التعليقات

Be the first to comment

Leave a Reply

Your email address will not be published.


*


This site uses Akismet to reduce spam. Learn how your comment data is processed.