بينما كنت أتصفح الأخبار في مجال دراسات كشف الزيف عبر المعالجة اللغوية وطرق التعلم الآلي استوقفتني دراسة يُمكن اعتبارها الأهم والأكثر اثارة للاهتمام من بين جميع ما اطلعت عليه. في مقدمة الدراسة يذكر ايوجينيو تاكيني (Eugenio Tacchini) أن طريقته مع زملائه تستطيع الوصول إلى دقة 99% حتى مع وجود عينة تدريب تقل عن 1%!
للتوضيح فإن التعلم الآلي هو طرق إحصائية تتعرف على الحل أو على النتائج من خلال الاعتماد على بيانات تم الحكم عليها مسبقاً بشكل صحيح من قبل الخبراء أو من قبل واقع البيانات، لتستطيع بعدها التعرف على بيانات أخرى من نفس الصنف بغياب الحلول أو النتائج. يتم ذلك من خلال الاحتساب بطريقة معقدة للعلاقات الرياضية بين المعطيات التي أدت لظهور النتائج. يشبه الأمر الطريقة التي نقوم بها بحل الألغاز عبر التنبؤ من خلال مسائل أخرى مشابهة.
أما كشف الزيف فله وسائل كثيرة، منها ما يعتمد على التعهيد الجماعي (crowdsourcing) وهو الحصول على المعلومات من خلال الجماهير والحشود الضخمة من الأشخاص والذي زاد الاعتماد عليه مع توفر الانترنت وتطور شبكات الاتصال مما يوفر معلومات من آلاف أو ملايين الأشخاص بشكل موجه أو تلقائي. فضلاً عن وسائل أخرى مثل فحص الحقائق (fact checking) والطرق الرياضية والاحصائية المباشرة.
يترتب على ذلك وجود بيانات متكاملة تقدم فيها النتائج للحاسوب لكي يقوم بضبط إعدادات معينة وخصائص معينة لهذه البيانات، ومن ثم تقدم له البيانات الخالية من النتائج ليتنبأ بها بشكل صحيح. عادة ما تصل الطرق الصحيحة والجيدة من التنبؤ والمزودة ببيانات سليمة إلى مستويات عالية من الدقة قد تزيد على 90% في السيناريوهات الناجحة جداً، أما الطرق التي تقارب مستوى الصدفة العشوائية في التنبؤ فهي ما تقارب الـ 50% حيث أننا لو أردنا أن نتوقع شيئاً دون وجود معطيات عنه فسنصل إلى نسبة 50% من الصواب.
ما قام به تاكيني يعتمد على التعهيد الجماعي لمئات الآلاف من الأشخاص وعبر تفاعلات الإعجاب التي يدلون بها في فيسبوك. صنف تاكيني مجموعة من الصفحات في فيسبوك (30 صفحة) بكونها صفحات تدعم العلوم الزائفة والخرافات أو صفحات علمية. ثم قام بتصنيف مئات الآلاف من الأشخاص بحسب الصفحات التي قاموا بالإعجاب بها، ليكون الأشخاص مصنفين بحسب مجموعتين، ثم قام بالاعتماد على مجموع الإعجابات التي يقوم بها الأشخاص من الطرفين لتحديد نوع المنشور، فيما إذا كان منشوراً زائفاً أم منشوراً علمي. وقد أدت طريقته نجاحاً باهراً دون الدخول في طرق الفحص اللغوي والتعامل على مستوى المفردات الواردة في المنشورات.
يُمكن أن تفتح دراسة تاكيني الآفاق أمام دراسات أخرى تتوسع في الحكم على المنشورات من خلال طبيعتها اللغوية أو مصادر نشرها عبر الرجوع إلى طريقة تاكيني كمرجعية، بالنظر للمستوى العالي من الدقة الذي توفره ودون الحاجة إلى معطيات كثيرة. كما يُمكن أن تفتح تلك الدراسة الباب للدراسة الإدراكية للاهتمامات الشخصية والانحياز بشتى أشكاله. ويُمكن أن تكشف لنا الدراسة ما يقوم به فيسبوك وما يعرفه عنا وعما نقوم به ونفكر به وبأشياء قد لا ندركها نحن عن أنفسنا.
ما يلفت النظر في هذه الدراسة، أننا نعيش في قوالب ثابتة من حيث نمط تفكيرنا تجاه الخرافة والعلم الزائف، إمكانية التمييز الدقيق للمنشورات بحسب الصفحات التي قمنا بالإعجاب بها تشير لشيء واحد، أن القالب الفكري الساذج والمليء بالخرافة لا يتقاطع بأي شكل مع القالب الفكري المعزز بالفكر النقدي والمنهج العلمي. وهذا يجعلنا نوجه أنظارنا بشكل جيد نحو أهداف أكثر دقة ونحن نناقش الأفراد أو نكتب المقالات أو نهتم بتدريس العلوم على صعيدنا الشخصي وعلى صعيد المناهج الدراسية في دولنا.
رابط الدراسة:
Tacchini, Eugenio, et al. “Some like it hoax: Automated fake news detection in social networks.” arXiv preprint arXiv:1704.07506 (2017).