بازار آریا
داده‏‏‌ها هم گویای همه واقعیت نیستند
دوشنبه 8 بهمن 1403 - 00:14:44
روزنامه دنیای اقتصاد
بازار آریا - مترجم: سید‌حسین علوی لنگرودی - alavitarjomeh@gmail.com اعداد چه کوچک باشند و چه بزرگ نمی‌‌‌توانند گویای همه چیز باشند. اعداد به‌‌‌مانند بچه‌‌‌هایی هستند که نیازمند توجه و راهنمایی هستند و باید آنها را فهمید و درک کرد. بحران همه‌‌‌گیری کووید- 19 به خوبی نشان داد که اعداد به تنهایی گویای واقعیت نیستند. هنگامی که در اواسط فوریه سال 2020 تعداد مبتلایان به ویروس ناشناخته کووید- 19 به ناگهان جهش شدیدی پیدا کرد و روز به روز افزایش بیشتری یافت تمام دنیا نگران شد.
اما در آن روزها اعداد معنی‌‌‌شان را از دست داده بودند. در یکی از یکشنبه‌‌‌های اواسط ماه مارس 2020 تعداد مبتلایان جدید برای اولین بار کاهش پیدا کرد و همین مساله خیلی‌‌‌ها را نسبت به فروکش کردن این بیماری امیدوار کرد و بعضی دولت‌‌‌ها صحبت از شروع پایان کووید- 19 به میان آوردند.
اما این اعداد کاهشی سرابی بیش نبودند، چرا که خیلی زود تعداد مبتلایان رو به افزایش رفت و مشخص شد که علت کاهش آمار مبتلایان در آن یکشنبه این بوده که آمار و ارقام مربوط به مبتلایان آخر هفته به خاطر تعطیلات گزارش نشده بود و آمار واقعی روز یکشنبه دو روز بعد اعلام شد که عدد بسیار بالایی بود. علت اصلی مشکل این بود که مقام‌‌‌های بهداشتی به صورت روزانه اقدام به جمع‌‌‌آوری آمار و ارقام مبتلایان آن روز می‌‌‌کردند و به این دلیل که در تعطیلات آخر هفته بسیاری از کارکنان در محل کارشان حضور نداشتند، امکان تجمیع و اعلام تمام آمار مبتلایان آن روز فراهم نبود.
در اینجا ممکن است از خود بپرسید که پس داده‌‌‌های بزرگ به چه دردی می‌‌‌خورند و چرا این قدر مورد توجه قرار گرفته‌‌‌اند؟ در پاسخ به این سوال باید گفت داده‌‌‌های بزرگ فقط زمانی به کار می‌‌‌آیند که اولا ما داده‌‌‌های معتبری در اختیار داشته باشیم و تئوری‌‌‌های خوبی هم برای هدایت تحقیقات به مسیر درست وجود داشته باشد و دوم و مهم‌‌‌تر اینکه شرایط و موقعیت‌‌‌ها هم ثابت و بدون تغییر باشند و خبری از دگرگونی و نوسان و ابهام نباشد.
پایش مبتنی بر پیش‌‌‌بینی با استفاده از داده‌‌‌های بزرگ
پایش مبتنی بر پیش‌‌‌بینی، از بسیاری جهات یک نوآوری فوق‌‌‌العاده و جادویی محسوب می‌‌‌شود، به‌‌‌طوری‌‌‌که مجله تایم در سال 2011 پایش مبتنی بر پیش‌‌‌بینی را به عنوان یکی از 50 اختراع سال معرفی کرد. این نوع پایش و کنترل پلیسی بر مبنای تکنولوژی داده‌‌‌های بزرگ کار می‌‌‌کند. طراحان آن مدعی هستند که الگوریتم‌‌‌های قدرتمندی را به وجود آورده‌‌‌اند که می‌‌‌توانند محل و زمان وقوع جرائم در آینده را پیش‌‌‌بینی کنند و افرادی را که احتمال ارتکاب جرمشان بالاست شناسایی کرده و آنها را تحت‌نظر بگیرند. اگر این ادعا درست باشد دیگر نیازی به این نیست که نیروهای پلیس در خیابان‌‌‌ها پرسه بزنند تا در صورت وقوع جرم وارد عمل شوند، بلکه کافی است در پاسگاه پلیس بنشینند و بررسی کنند که برنامه پایش و کنترل مبتنی بر پیش‌‌‌بینی چه می‌‌‌گوید. در سال 2012 ادارات پلیس در شهرهای شیکاگو و لس آنجلس شروع به استفاده گسترده از این برنامه کردند و در نتیجه یک بانک اطلاعاتی بزرگ حاوی اطلاعات مربوط به بیش از 400 هزار نفر که احتمال ارتکاب جرمشان از طرف نرم‌‌‌افزار پایش مبتنی بر پیش‌‌‌بینی، بالا یا بسیار بالا ارزیابی شده بود تهیه شد. اما بعد از چند سال مشخص شد که بخش زیادی از پیش‌‌‌بینی‌‌‌های ارائه شده توسط این نرم‌‌‌افزار اشتباه از آب درآمده و در عمل این نرم‌‌‌افزار قادر به پیش‌‌‌بینی زمان و مکان ارتکاب جرائم نبود. علاوه بر این، مشخص شد که این نرم‌‌‌افزار دارای سوگیری زیادی است، به طوری که 89درصد کسانی که از طرف این نرم‌‌‌افزار به عنوان افراد دارای احتمال بالای ارتکاب جرم و جنایت معرفی شده بودند، افراد رنگین پوست بودند و به خاطر افشای همین مشکلات و نواقص بود که استفاده از نرم‌‌‌افزار پایش مبتنی بر پیش‌‌‌بینی در سال 2019 متوقف شد.
حال سوال اینجاست که چرا برنامه پایش مبتنی بر پیش‌‌‌بینی ناکام ماند و نتوانست آن‌‌‌چنان که باید و شاید به کار آید؟ بعضی‌‌‌ها پاسخ این سوال را به محدود بودن داده‌‌‌های مورد استفاده برای پیش‌‌‌بینی‌‌‌های انجام شده توسط این برنامه نسبت می‌‌‌دادند و معتقد بودند که با افزودن به حجم داده‌‌‌های مورد استفاده نرم‌‌‌افزار پایش مبتنی بر پیش‌‌‌بینی می‌‌‌توان بر دقت و درستی پیش‌‌‌بینی‌‌‌های آن افزود. اما واقعیت این است که مشکل و مانع اصلی پیش روی این نرم‌‌‌افزار، وجود ابهام و نامعلوم بودن رفتارهای مجرمانه انسان بود، به‌‌‌طوری‌‌‌که مشخص شد فقط با استناد به رفتارهای گذشته افراد و پرونده‌‌‌های قبلی نمی‌‌‌توان رفتارها و پرونده‌‌‌های آینده را پیش‌‌‌بینی کرد. علاوه بر این، احتمال آلوده ‌‌‌شدن و جهت‌‌‌دار شدن اطلاعات و داده‌‌‌ها به‌‌‌واسطه وجود سوگیری‌‌‌های نژادی و قومیتی و مذهبی نیز وجود دارد.
یکی از گزینه‌‌‌های جایگزینی برنامه‌‌‌هایی مانند پایش مبتنی بر پیش‌‌‌بینی که با الگوریتم‌‌‌های پیچیده‌‌‌ای کار می‌‌‌کنند که در برابر ابهامات دچار درماندگی می‌‌‌شوند، هوش مصنوعی روان‌‌‌شناسانه است. هوش مصنوعی روان‌‌‌شناسانه از الگوریتم‌‌‌های ساده‌‌‌تر اما کاربردی‌‌‌تری بهره می‌‌‌برد و می‌‌‌کوشد تا با بهره‌‌‌گیری از داده‌‌‌های بزرگ به شکلی شفاف و با جامع‌‌‌نگری بیشتر به کمک پلیس بیاید؛ هر چند که شائبه‌‌‌هایی مانند وجود سوگیری و تبعیض‌‌‌های نژادی و جنسیتی در مورد هوش مصنوعی روان‌‌‌شناسانه نیز وجود دارد.
منبع: کتاب The age of AI: and our human future

https://www.bazarearya.ir/fa/News/1255832/داده‏‏‌ها-هم-گویای-همه-واقعیت-نیستند
بستن   چاپ