قام باحثون من معهد ماساتشوستس للتكنولوجيا بتطوير نموذج حاسوبي جديد يُحاكي آلية عمل المخ البشري في التعرف على الوجوه، هذا النموذج الجديد يعتمد في آلية عمله على علم الأعصاب، وهو الأمر الذي كان يتم تجاهله في النماذج الأخرى.
قام الباحثون بتصميم نظام ذاتي التعلم لتنفيذ نموذجهم الجديد، ودربوه على التعرف على أوجه محددة عن طريق إمداده بمجموعة من الصور. وجدوا أن ذلك النظام يعتمد على معالجة الصور ذات درجة معينة من الدوران 45 درجة على سبيل المثال وليس على اتجاه الصور سواء يميناً أو يساراً.
هذه الخاصية لم تكن موجودة في النظام عند تصميمه، بل ظهرت تلقائياً نتيجة للتدريب المُستمر. هذه الخاصية تُشبه تماماً آلية التعرف على الوجوه عند الرئيسيات، لذا يعتقد الباحثون أن هذا يُمثل دليلاً على أن هذا النظام الجديد والمخ البشري يعملان بطريقة مُتشابهة نوعاً ما.
صرح البروفيسور توماسو بوجيو (Tomaso Poggio) أستاذ علم الأعصاب وعلوم الإدراك بمعهد ماساتشوستس بأن ذلك لا يُعد دليلاً على أننا نفهم كيفية سير الأمور (أي آلية تعرف المخ على الوجوه) ، فهذه النماذج هي بمثابة رسوم كرتونية للحقيقة وخصوصاً في علم الأحياء. قال أيضاً أنه سيكون مُندهشاً لو اتضح أن الأمور تسير بهذه البساطة، لكنه اعتبر في الوقت ذاته أن هذا يُعد دليلاً قوياً لكونهم على الطريق الصحيح.
في الحقيقة، الورقة البحثية الجديدة التي أعدها الباحثون تشتمل على دليل رياضي على أن هذا النظام ذاتي التعلم، والذي كان من المُفترض أن يقدم نموذجاً معقولاً للجهاز العصبي من الناحية البيولوجية، سيُنتج حتماً بيانات وسيطة لا تأخذ بالاعتبار زاوية الدوران عند مُعالجة الصور.
البروفيسور بوجيو هو باحث رئيسي بمعهد ماكغفرن لأبحاث الدماغ (McGovern Institute for Brain Research)، وهو أيضاً الكاتب الأقدم للورقة البحثية التي تصف هذا العمل الجديد والتي نُشرت اليوم في جريدة الأحياء الحاسوبية (Journal of Computational Biology). ضم بوجيو لورقته البحثية عدة أعضاء آخرين بمعهد ماكغفرن ومعهد CBBM: الباحث الأول هو جويل ليبو (Joel Leibo) وهو باحث في شركة جوجل ديبمايند (Google DeepMind)، حصل جويل على شهادة الدكتوراه في علم الأعصاب والإدراك من معهد ماساتشوستس، حيث كان مُشرف رسالته هو البروفيسور بوجيو. العضو الثاني هو كيانلي كياو (Qianli Liao) وهو طالب بنفس المعهد، يدرس الهندسة الكهربائية وعلوم الكمبيوتر. العضو الثالث هو فابيو انسيلمي (Fabio Anselmi)، وهو أستاذ بمعمل ماساتشوستس للتعلم الإحصائي والحاسوبي، وهو مشروع مشترك بين كل من معهد ماساتشوستس والمعهد الإيطالي للتكنولوجيا (Italian Institute of Technology). وأخيراً وينريتش فريوالد (Winrich Freiwald) وهو أستاذ مُساعد بجامعة روكفلر.
الخواص الناشئة
صرح البروفيسور بوجيو بأن الورقة البحثية هذه هي بمثابة شرح لطيف لما يودون أن يُنجزونه في معهد CBMM، ألا وهو دمج كلاً من النظام ذاتي التعلم وعلم الحاسوب من ناحية، وعلم الأعصاب ونواحي السلوك البشري من ناحية أخرى. قال أيضاً بأن ذلك لا يعني فقط توضيح الخوارزميات التي يستخدمها المُخ، لكن أيضاً الشبكات التي تقوم بهذه الخوارزميات داخل المُخ.
اعتقد بوجيو طويلاً بأن المخ لابد وأنه يُنتج تمثيلات ذهنية ثابتة للوجوه والأشياء الأخرى، وأن هذه التمثيلات لا تتأثر بشكل الأشياء في الفراغ ولا بالمسافة بينها وبين المُشاهد وأيضاً لا تتأثر بموقع الأشياء في المجال البصري. قدم مسح الرنين المغناطيسي لأدمغة كل من البشر والقردة تصورات مشابهة، لكن في عام 2010 نشر البروفيسور فريوولد دراسة جديدة تشرح التركيب العصبي لآلية قيام قردة المكاك بالتعرف على الوجوه، وذلك بصورة أكثر تفصيلاً.
وضح فريوولد أن المعلومات من الأعصاب البصرية الخاصة بالقردة تمر بعدة مناطق في المخ، كلاً منها أقل حساسية تجاه الوجه في الفراغ من الأخرى. الأعصاب في المنطقة الأولى تستجيب فقط لوضع معين للوجه، أما الأعصاب في المنطقة الأخيرة فتستجيب وتُطلق نبضاتها العصبية بغض النظر عن وضع الوجه في الفراغ.
بعض الأعصاب في منطقة وسطى من المخ تعمل وكأنها مرآة مُتماثلة، بمعنى أنها تكون حساسة لزاوية دوران الوجه بغض النظر عن اتجاهه. في المنطقة الأولى، ستقوم مجموعة معينة من الأعصاب بالاستجابة لو أن وجهاً ما دار بزاوية 45 درجة إلى اليسار، ومجموعة أخرى تستجيب إذا ما دار بزاوية 45 درجة لكن إلى اليمين. في المنطقة الأخيرة، نفس المجموعة من الأعصاب ستستجيب إذا ما دار الوجه بزاوية 30 درجة، 45 درجة أو 90 درجة أو أي زاوية بينها. لكن في المنطقة الوسطى، مجموعة معينة من الأعصاب ستستجيب إذا ما دار الوجه بزاوية 45 درجة في أي اتجاه، مجموعة أخرى تستجيب لزاوية 30 درجة وهكذا.
تدريب الأعصاب
النظام ذاتي التعلم الذي أعده الباحثون هو شبكة عصبية، وسُمي كذلك لأنه يشبه تركيب المخ البشري إلى حد ما. الشبكة العصبية تتكون من وحدات مُعالجة بسيطة للغاية ومُرتبة في عدة طبقات بحيث تكون متصلة بكثافة بوحدات المعالجة الأخرى في الطبقات العُليا والسُفلى. يتم إدخال البيانات إلى الطبقة السُفلى من الشبكة، والتي تُعالجها بشكل ما وتُمررها للطبقة التالية وهكذا. خلال التدريب، وُجد أن مُخرجات الطبقة العُليا في الشبكة تتناسب مع بعض الخواص التصنيفية _ لنقل مثلاً أنها تُحدد بصورة صحيحة إذا ما كانت صورة ما تصف شخصاً مُعيناً أم لا.
في بدايات العمل، درب فريق بوجيو الشبكات العصبية على تقديم تمثيلات ثابتة وذلك عن طريق تذكُر بيانات لمجموعة من الإتجاهات التي تخص حفنة من الوجوه، سماها بوجيو بـ “القوالب” . عندما كانت الشبكة تتعامل مع وجه جديد، كانت تقوم بقياس مدى اختلافه عن هذه القوالب.
الإختلاف كان عند الحد الأدنى بالنسبة للقالب الذي كانت اتجاهاته تُماثل تلك الخاصة بالوجه الجديد، وكانت مُخرجات العقد العصبية المُتعلقة بها في النهاية هي المُتحكمة بإشارات المعلومات حالما تصل للطبقة العُليا. الاختلاف المُقاس بين الوجه الجديد والأوجه المُخزنة (القوالب) يُعطي الوجه الجديد نوعاً من التعريف أو البصمة الخاصة به.
في التجارب، قدمت هذه الطريقة تمثيلات ثابتة: أي أن بصمة وجه ما ظلت ثابتة بغض النظر عن اتجاهه في الفراغ، لكن الآلية التي تم بها ذلك وهي تذكر الوجوه لم تكن مقبولة من الناحية البيولوجية بحسب بوجيو.
لذا بدلاً من ذلك، فإن الشبكة الجديدة تستخدم تنوعاً ما من مبدأ “هيب” والذي يُوصف غالباً في أدبيات علم الأعصاب بأنه “الأعصاب التي تطلق نبضات عصبية معاً، هي الأعصاب التي تتشارك بنفس الغُلاف العصبي”. هذا يعني بأنه خلال التدريب، بينما يتم تعديل مدى الإتصالات بين العُقد العصبية المختلفة لإنتاج منتج أكثر دقة، فإن العُقد التي تتفاعل بشكل مُتناسق مع مُحفزات معينة، تُساهم في المنتج النهائي أكثر من تلك العقد التي تتفاعل بشكل مُستقل عن الأخرى (أو تلك التي لا تتفاعل على الإطلاق).
هذه الطريقة أيضاً أنتجت تمثيلات ثابتة كسابقتها، لكن الطبقات الوُسطى من الشبكة أصبحت تُماثل الاستجابات المتناظرة الخاصة بالمناطق الوُسطى للمُعالجة البصرية في أدمغة الرئيسيات.
يُصرح كريستوف كوخ (Christof Koch) المُدير العلمي لمعهد ألين لعلوم المخ والأعصاب (Allen Institute for Brain Science) بأنه يعتقد أن هذا يُمثل خطوة هامة للأمام، ففي عصرنا هذا حيث يتم التحكم في كل شيء بواسطة إما بيانات ضخمة أو محاكاة حاسوبية عملاقة، وهذا يُوضح لنا كيف أن فهم التعلم القائم على المبادئ يُمكن أن يُفسر بعض النتائج المُحيرة، وأوضح أن الباحثين حريصون للغاية، فهم ينظرون فقط لمسار التغذية العصبية المسبقة _ أي ال 80 إلى 100 مللي ثانية الأولى. يفتح القرد عيناه، وفي غضون 80 إلى 100 مللي ثانية، يستطيع التعرف على وجه ما، ويضغط على زر معين مُشيراً لذلك. السؤال هو عما يدور في هذه 80 إلى 100 مللي ثانية، وهذا النموذج لدى الباحثين يبدو وأنه يفسر ذلك بطريقة جيدة.
المصدر:
Larry Hardesty, “How the brain recognizes faces“, MIT News Office, news.mit.edu, December 1, 2016