علم داده و علوم انسانی

ترکیب علوم داده‌ها با مهارت‌های مربوط به علوم اجتماعی و علوم انسانی

نویسنده: محمدرضا ملکی

تخمین زمان مطالعه: ۷ دقیقه


بسیاری از پژوهشگران و متخصصان علم داده‌ها اذعان دارند که هر روزه متوجه تلاقی علوم اجتماعی و علم داده هستند. در این تلاقی منظور از علم داده‌ها در واقع معماری، فرآیندها و همین‌طور ابزارهای تکنیکی کامپیوتری‌ای هستند که برای فهم اجتماعی مسئله مورد استفاده قرار می‌گیرند.


علم داده‌های انتقادی و مهارت‌های مربوط به علوم انسانی

این امر  تقریباً در دنیای امروزه امری قابل قبول است که تکنولوژی نیازمند فارغ‌التحصیل‌های رشته‌های علوم انسانی است. مهارت‌های مربوط به تفکر انتقادی فهم عمیق‌تر از جهان اطراف، وجود رشته‌هایی مانند فلسفه، ارتباطات همه‌ی این‌ها دست در دست هم باعث آسان نمودن فرآیندهای حل مسائل مختلف و خلاقیت می‌شوند.

می‌توان گفت علوم انسانی می‌تواند روح داده‌های منتج شده از علم داده‌ها باشد. گسترش روزافزون علوم کامپیوتری حالا به نقطه‌ای رسیده است که تنها به تحلیل محض داده‌ها نمی‌تواند اکتفا کند. در کنار تحلیل صرف داده‌ها، برای رسیدن به یک نتیجه‌ی مطلوب در بسیاری از پژوهش‌های علوم انسانی استفاده از ظرفیت‌های تفکر انتقادی یک امر لازم محسوب می‌شود.

در کنار نیاز به تفکر انتقادی، مکانیسم‌های تحلیل داده بیش از پیش نیازمند یک جنبه‌ی انسانی نگاه کردن به پدیده‌ها هستند. در واقع می‌توان گفت که حالا علم داده‌ها نیازمند انسانی شدن است. ماشینی شدن یادگیری و آموزش داده‌ها نمی‌تواند به تنهایی از پس حل مشکلات انسانی برآید.

از این رو الگوریتم‌های مختلف نیازمند دخالت انسانی برای تحلیل و انتخاب بهتر داده‌ها هستند. علوم انسانی در این میان کمک می‌کند که طراحی و برخورد با داده‌های مختلف به صورت مؤثرتری صورت پذیرد. این امر البته بدیهی است که فرایند جمع‌آوری داده و همین‌طور تحلیل آن نیازمند توانایی و مهارت‌های ارتباطی و تحلیلی است که پیش از آن در میان مهارت‌های قابل ارائه در رشته‌های علوم انسانی از پیش وجود داشته است.

در گذشته تیم‌های تحلیل داده‌ها تنها به تخصص خاص هر یک از اعضای تیم بسنده می‌کردند. این ترکیب از توانایی‌ها و مهارت‌ها باعث کاهش میزان خلاقیت اعضای تیم برای پیشبرد یک هدف مشترک می‌شده است. با ترکیب مهارت‌های مربوط به رشته‌های علوم انسانی با مهارت‌های صنعتی و تخصصی حجم گسترده‌ای از تفاوت‌های کارکردی ایجاد شده و میزان خلاقیت تیم‌های مختلف نیز افزایش می‌یابد.

علم داده‌های انتقادی به زعم پژوهشگران مختلف یکی از اصطلاحاتی است که از دل مهارت‌های تفکر انتقادی رشته‌های علوم انسانی ناشی می‌شود. یکی از مهم‌ترین اعمال مربوط به تحلیل داده‌ها، پاک‌سازی داده‌هاست. برخی از الگوریتم‌ها توانایی انجام این امر را از پیش دارند.

با اینکه انجام عمل‌های تکراری و طاقت‌فرسای پاک‌سازی و تحلیل داده‌های بزرگ خارج از توانایی یک انسان است، اما رها کردن کامل فرآیندها به دست ماشین‌ها می‌تواند به علت وجود نابرابری در الگوریتم‌های از پیش نوشته شده باعث به وجود آمدن تبعیض شود.

از این رو تفکر انتقادی در برخورد با مکانیسم‌های اساسی پاک‌سازی یا انتخاب و یا حتی تحلیل داده‌ها می‌تواند از پیش باعث ایجاد توازن در بسیاری از الگوریتم‌ها شود.

علوم اجتماعی و علم داده‌ها

بسیاری از پژوهشگران و متخصصان علم داده‌ها اذعان دارند که هر روزه متوجه تلاقی علوم اجتماعی و علم داده هستند. در این تلاقی منظور از علم داده‌ها در واقع معماری، فرآیندها و همین‌طور ابزارهای تکنیکی کامپیوتری‌ای هستند که برای فهم اجتماعی مسئله مورد استفاده قرار می‌گیرند.

البته این تعریف برای علم داده‌ها تقریب تعریفی محدود شده است چراکه عمده فعالیت‌های یک پژوهشگر یا متخصص در این حوزه شامل تحلیل داده، پاک‌سازی داده و یا به نمایش در آوردن نتایج و … نیز می‌شود. در کنار تمام موارد محاسبات ریاضیاتی و یا مهارت‌های مربوط به علوم کامپیوتر، سؤال بسیار بزرگی برای بسیاری در حین کار با علم داده‌ها پدید می‌آید. نقش واقعی علوم اجتماعی کجاست؟

انقلاب دیجیتال که از میانه قرن بیستم آغاز شد دنیای ما را تحت تغییرات وسیعی در همه‌ی ابعاد قرار داد و هنوز این تغییرات به روند خود با سرعت ادامه می‌دهد. در حال حاضر ما یک اقتصاد بر مبنای داده‌ها و همین‌طور یک جامعه داده محور داریم.

سیستم تقاضا و عرضه در دنیای امروز توسط شرکت‌ها همیشه ردی در اینترنت به جای می‌گذارد و بسیاری از رفتارهای اجتماعی کاربران در فضای مجازی تشکیل حجم عظیمی از داده‌ها را می‌دهند که به آن کلان داده گفته می‌شود.

اطلاعات و دانش با نرخ بسیار زیاد و غیر قابل پیش بینی‌ای در حال تولید و ذخیره شدن است. این اطلاعات می‌تواند توسط زندگی روزانه‌ی بسیاری از انسان‌ها ساخته شود. از احساسات و ابراز آن در فیس‌بوک تا نظرها و اشتراک نظر در شبکه‌های اجتماعی دیگری مثل توییتر و یا ایجاد اطلاعات تصویری مانند پست‌های اینستاگرام و داده‌هایی مثل مکان و زمان حضور در یک محل که توسط gps جمع‌آوری می‌شوند.

همه‌ی این موارد جزو داده‌هایی هستند که به صورت ساده صرفاً با زندگی عادی ما ساخته می‌شوند و توسط بسیاری از کمپانی‌ها نگه‌داری می‌شوند.

دیگر داده‌ها و اطلاعات از تراکم اطلاعات رسانه‌ها به دست می‌آید. منابع خبری آنلاین  وبلاگ‌ها و وب‌سایت‌های مختلف و نظرها و دیدگاه‌های مختلفی که در بسیاری از فضاهای موجود در وب ثبت می‌شوند از جمله همین اطلاعات متراکم موجود هستند.

وجود حجم اطلاعات بالایی از این دست می‌تواند سؤال‌های بسیاری را در حوزه‌های مختلفی مانند کسب‌وکار، حوزه‌های علوم سیاسی و همین‌طور علوم اجتماعی را حل کند.

البته بسیاری از اطلاعاتی که از پردازش و تحلیل داده‌های مختلف توسط علوم کامپیوتر به دست می‌آیند نمی‌توانند با توجه به عدم دخالت علوم انسانی در بین آن‌ها، پاسخ‌هایی درخور به مسائل درونی علوم انسانی بدهند.

این یعنی داده‌ها و اطلاعات نمی‌توانند به تنهایی مسائل زیادی را که در جامعه موجود هستند را حل کنند اما در عین حال کمکی شایانی به حل مسئله خواهند کرد. در حال حاضر با وجود کلان داده‌ها و علم داده‌ها حل مسائل اجتماعی می‌توانند با کمک راحت‌تر ساخته شدن تئوری‌های جدید به سادگی رخ دهد. همچنین با داشتن چنین توانایی‌هایی حل مسائل غیرممکن پیشین صاحب بارقه‌هایی از امید برای حل شده است.

اما صرفاً داشتن کلان داده‌ها و حجم زیادی از داده‌های مختلف در این مسیر راهگشا نیست. داشتن توانایی حل مسئله‌ی کامپیوتری و ترکیب آن با توانایی تحلیل و ترکیب داده‌های مختلف در کنار اندازه‌گیری دقیق از جمله راه‌حل‌های دست یافتن به نتیجه‌ی مطلوب در علم تحلیل داده‌هاست.

با این حال اینترنت در حال حاضر یک محیط طبیعی برای شروع پژوهش‌های اجتماعی است. در دهه‌ی ۸۰ میلادی که اینترنت در حال شکل‌گیری ابتدایی خود بود، دانشمندان علوم اجتماعی آن را در ابتدا به عنوان میدانی اجتماعی بسیار گسترش‌پذیر دیدند.

در دهه‌ی ۹۰ میلادی اینترنت شروع به وارد شدن به خانه‌های مردم کرد و ارتباطات ایمیلی به عنوان اولین شکل ارتباط اینترنتی شکل گرفت. در دهه‌ی اول قرن بیست و یکم نیز همین‌طور که اینترنت در حال پیشرفت بود حجم زیادی از داده‌ها در حال گرد هم آمدن قرار گرفت. این داده‌ها در ابتدا موردتوجه هیچ‌کسی قرار نگرفته بودند.

هر چند با ظهور کمپانی‌هایی مانند گوگل ذره‌ذره این اطلاعات که به صورت ناخواسته تولید شده بودند به اطلاعات از پیش درخواست شده و مورد مطالعه قرار گرفته توسط بسیاری از کمپانی‌ها و پژوهشگرها قرار گرفتند.

این رشد و در واقع وجود داده‌های مختلف به علوم معاصر اجتماعی کمک شایانی کرد که از دسترس‌پذیری بالای اطلاعات بهره برده و با استفاده از ابزارهای محاسباتی تحلیل داده‌ها میدان‌های جدیدی برای پژوهش در علم داده‌ها و علوم اجتماعی به وجود بیاورد.

منابع

https://becominghuman.ai/my-journey-from-history-to-data-science-ad3619b664a2

https://towardsdatascience.com/humanities-graduates-should-consider-data-science-d9fc78735b0c

https://www.dataquest.io/blog/humanities-learn-data-science/

برای مطالعه بیشتر، مطلب زیر را در سایت بردار بخوانید:

پروژۀ دین و دولت: نمونه‌ای از مجموعه داده‌های بین‌المللی علوم اجتماعی-۱

1+

افزودن دیدگاه

لطفا دیدگاه خود را بنویسید
لطفا نام خود را وارد کنید

8 + سه =