السادة شركة أمازون، نظامكم لابد أن يكون متحيزاً

ا

هذا المقال مترجم عن مقال منشور من مدونة  medium للكاتب سالم العلياني بتاريخ 22—أكتوبر 

قبل بضعة أيام ، ذكر تقرير لرويترز أن أمازون قد أوقفت محرك الذكاء الاصطناعي للتوظيف الخاص بها. وزعموا أن النظام متحيز ضد طلبات النساء المتقدمات. ذكر التقرير: ”بأن النظام قام بتعليم نفسه أن المرشحين الذكور هم الأفضل“. الحقيقة هي، أن النظام لم يُعلّم نفسه كما ادعت الشركة. ولكن الحقيقة هو أن الشركة نفسها منحازة وإلا لما كان النظام كذلك. لقد قامت شركة أمازون عند بناء النظام بـتغذيته ببيانات 10 سنوات وهي البيانات التاريخية للتوظيف لدى الشركة. الشركة نفسها هي بيئة يسيطر عليها الذكور. ووفقًا للتقرير نفسه ، فإن 60 ٪ من موظفي أمازون هم من الذكور. يذكر تقرير آخر صادر عن بلومبرج في عام 2018 أن 73 ٪ من موظفي أمازون المحترفين هم من الرجال.

ماالذي حدث بالضبط؟

تتعلم خوارزميات تعلم الآلة بناء نماذج تنبؤية ووصفية بناءً على البيانات التي يتم تمريرها إلى الخوارزمية. حيث أن البيانات لها توزيع خفي (hidden distribution). لا يمكن أن تتعلم الخوارزمية دون تمثيل البيانات بطريقة أو بأخرى. إما أن نحدد ميزات البيانات أو أن الخوارزمية تتعرف على الميزات بنفسها. في السيناريو الأخير، لا يمكننا عادة تبرير قرارات النموذج. ومع ذلك ، في السيناريو الأول ، يمكننا تفسير سبب اختيار الخوارزمية لهذا القرار. و في كلتا الحالتين يتم استخراج الميزات أو اختيارها من البيانات المتوفرة. و البيانات في الحقيقة هي عبارة عن نتائج قياساتنا وقراراتنا وملاحظاتنا وقراءاتنا وما إلى ذلك.

نحن كبشر نميل إلى أن نكون متحيزين ضد الإتجاه المختلف والأشياء الجديدة. يؤثر التحيز المعرفي (cognitive bias) على قراراتنا وأحكامنا. وكل هذا يعتبر طبيعي بسبب القيود في الدماغ البشري. وإذا كنا نرغب في اتخاذ القرار الأمثل أو النموذجي ، فيجب أن يكون لدينا وقت وموارد غير محدودة. حيث أن الوقت والموارد المحدودة تؤدي إلى اتباع نهج مبسط لمعالجة المعلومات التي نمتلكها. ونتيجة لذلك، فإننا نميل إلى تجاهل الكثير من الحقائق والتفاصيل الصغيرة وهو مايولد لدينا اتخاذ قرارات مختصرة. دماغ الإنسان يٌكيِّف نهج و أسلوب ارشادي للتفكير (heuristic). وهو السبب بأن معظم قراراتنا وأحكامنا وخياراتنا أو حتى عواطفنا ليست مثالية. أيضًا، هذا هو السبب في أننا لا نورث الخبرة المعرفية عبر الأجيال المختلفة.

في الذكاء الاصطناعي وتعلم الآلة بشكل خاص، يتم التحقق من صحة دقة النموذج مقابل خط الأساس (baseline) الذي يتم إنشاؤه في الغالب من تجربة و ملاحظة الإنسان. أفضل نموذج هو النموذج الذي سيكون قادرًا على محاكاة قدراتنا الإدراكية. لكنانتظر! نحن متحيزون. لذلك،ينبغي أن يكون أفضل نموذج متحيز كما هو حالنا تماما!

لتجنب هذا التحيز ، يمكننا أن نذهب مع أحد الخيارات التالية:

  • إيقاف أنظمة الذكاء الاصطناعي لتجنب التحيز. يبدو الأمر سهلاً ولكن لن يقبل أصحاب العمل التجاري مثل هذا الاختيار نظرًا لتأثيره على نمو الأعمال واتجاه الابتكارات.
  • المعالجة المسبقة للبيانات. نظرًا لأن البيانات متحيزة بطبيعتها ، يجب علينا دراسة البيانات وإزالة أي ميزة تٌسهِم في التحيز بطريقة أو بأخرى. على سبيل المثال ، في بيانات أمازون قد نزيل أيٍ من الخصائص أو الميزات التي تحدد الجنس. أعتقد أن تنظيف البيانات ومعالجتها المسبقة ليست بهذه البساطة. نحن بحاجة إلى قضاء جزء كبير من الوقت لإعداد البيانات.
  • ضبط معاملات (parameters) النموذج. بحيث أن نعطي وزنا أكبر (more weight) لمعاملات معينة ، مثل: التنوع في نموذج التعلم. ومع ذلك، يبقى السؤال أيهما أكثر أهمية: المؤهلات أم التنوع. ولكن في نهاية المطاف، فإن ضبط المعاملات ليس مهمة صعبة للغاية وقد تؤدي إلى إنشاء ورقة بحثية علمية قابلة للنشر. ヅ
  • أخذ الإعتبار بالتعلم القائم على عناصر البيانات وليس على بناء النموذج (instance). يتغير توزيع البيانات والخصائص الأساسية بسرعة ، ويعرف أيضا بتحول البيانات (data shift). وبالتالي، نحن بحاجة إلى أخذ هذا التغيُّر السريع في الاعتبار. وأحد الطرق هي عند بناء نموذج عدم أخذ جميع نقاط البيانات التي لدينا بالاعتبار في وقت التنبؤ أو التصنيف. سيؤدي ذلك إلى تخفيف التحيز في كل مرة يكون لدينا فيها عينة جديدة ، يفترض أنها غير متحيزة. ومع ذلك، قد ينتهي بنا المطاف متحيزون ضد الجانب الآخر. أي ينتهي بنا المطاف ضد الذكور في قضية أمازون.
  • امتلك موارد حاسوبية وبيانات و وقتا غير محدد. الوقت والموارد الحسابية يمكن حلها باستخدام قدرات حوسبة عالية الأداء في خدمات أمازون للويب، وهو أن البيانات متعددة المصادر والغير محددة من المستبعد جدا الحصول عليها والتعلم منها. تتعلم معظم خوارزميات تعلم الآلة من مجموعة بيانات منظمة ومتجانسة للغاية. ليس من السهل التعلم من البيانات غير المهيكلة و غير المتجانسة.
  • تغيير أدوات قياس الخطأ. مقاييس الخطأ الحالية تقيِّم أداء التعلم باستخدام المسميات الأساسية السابقة مقابل تلك المتوقعة. إذا اعتقدنا أن تعلم التحيز ليس جيدًا ، فنحن بحاجة إلى معاقبة هذا التحيز. يجب أن نعرف التحيز باتجاه سمات محددة كخاصية ملحقة غير مرغوب بها!
  • نحن نعيش فقط مع التحيز. أمازون يُسيطر عليها من قبل موظفين ذكور. لماذا يدمرون النظام الذي يحاول تقليد سلوكهم المتحيز. لماذا لا يغيرون سلوكهم التحيزي؟ أعتقد أن الموارد البشرية في أمازون سوف تكون دائمًا منحازة اتجاه شيء ما بسبب حقيقة أن لديهم معايير الاختيار.

عن الكاتب

محمد مهنا
محمد مهنا

اضافة تعليق

محمد مهنا

محمد مهنا

التواصل

أي مقال سأكتبه يكون المستهدف منه المتخصص فسأكتب ذلك في بداية المقال بإذن الله.

سأقدر كثيراً التعليقات التي تثير التساؤلات، وتناقش الأفكار، وتثري الموضوع..