چند مثال کاربردی در استفاده از زبان برنامه نویسی R و نرم افزار R در علوم اجتماعی

معرفی زبان برنامه نویسی R و بستر نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی- بخش دوم

نویسنده: محمدرضا ملکی

تخمین زمان مطالعه: ۹ دقیقه


اگر شما یک دانشجو و یا متخصص علوم انسانی هستید که دنیای کدنویسی و ریاضیات پیش چشم شما امری غریب و حتی سخت معلوم می‌شود از خواندن این مطلب اصلاً نهراسید. یادگرفتن کدنویسی درست مانند فراگرفتن مهارت‌هایی مانند مهارت رانندگی ست. این مطلب در سه بخش تهیه شده است. بخش اول معرفی مختصری از زبان برنامه‌نویسی R و نرم افزار R  است که می‌توانید آن را در اینجا بخوانید.

در این نوشته در بخش دوم، چند مثال کاربردی در استفاده از زبان برنامه نویسی R و نرم افزار R در علوم اجتماعی و  نمایش نتایج آن آورده شده است.


فهم کاربرد نرم افزارها و زبان‌های برنامه نویسی آماری در علوم انسانی و به‌ویژه در علوم اجتماعی نیازمند فهم کاربرد اساسی علم آمار در آن‌هاست. دانشمندان حوزه‌ی علوم اجتماعی از گستره‌ی وسیعی از روش‌های آماری برای پژوهش‌های خود استفاده می‌کنند. بسیاری از بسته‌های نرم افزاری ارائه شده در نرم افزار R می‌توانند نیازهای پژوهش‌هایی از این دست را پوشش دهند. متغیرهایی مانند واریانس، میانگین، رگرسیون و یا ضرایب معنی‌دهی و همبستگی و همین‌طور مدل‌های آماری بسیاری می‌توانند در نرم افزار R به راحتی محاسبه شوند.

  • نمودارها و کانتورهای سه‌بعدی در زبان برنامه نویسی R

در رهگذر فهم مفاهیم آماری مختلف می‌توان به قابلیت‌های زبان برنامه نویسی R بیش از پیش واقف شد. برای مثال در یکی از پژوهش‌های اجتماعی صورت گرفته با توجه به تکرار جرایم مربوط به مواد مخدر در طول سال‌های ۱۳۵۸ تا ۱۳۸۵ در ایران فرضیه‌هایی در مورد نسبت تکرار و تعدد جرایم با میزان تورم و بیکاری مطرح شده است {۱}.لنگرنرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعیهمان‌طور که در نمودار بالا مشاهده می‌کنید به‌صورت عادی نمی‌توان در یک نمودار دوبعدی هر سه متغیر فرضیه را یعنی تورم، بیکاری و تعداد جرایم مربوط به مواد مخدر را ترسیم کرد. از جمله ابزارهای موجود در نرم افزارهای آماری مانند نرم افزار R ترسیم فضای سه‌بعدی موجود میان متغیرهای مختلف است. در نمودار یا کانتور بالا می‌توان مشاهده کرد که در جایی که طیف رنگی به سمت رنگ قرمز حرکت می‌کند میزان بیکاری، تورم و جرم در بیشینه‌ی خود قرار دارد. با این نمودار به راحتی سه متغیر و رابطه‌ی آن‌ها قابل‌نمایش است.

  • محاسبه‌ی ضرایب همبستگی و رگرسیون در زبان برنامه نویسی R

برای محاسبه‌ی میزان ربط متغیرهای متفاوت، نیازمند محاسبه‌ی ضریب همبستگی و وابستگی داده‌های مختلف هستیم. از جمله مدل‌های مختلفی که می‌توان در نرم افزار R تحلیل کرد، محاسبه‌ی ضرایب همبستگی و وابستگی با داده‌ها و متغیرهای مختلف یک مسئله است. در واقع ضریب همبستگی عامل تعیین نوع و درجه‌ی رابطه‌ی متغیر کمی با دیگر متغیر کمی موجود در فرضیه است. در بسیاری از پژوهش‌های اجتماعی محاسبه‌ی این ضریب کمک می‌کند که فرضیه‌های مختلف به‌راحتی مورد وثوق قرار گیرند و تحلیل‌های مختلف پیچیده‌ی موجود در یک مسئله‌ی اجتماعی و انسانی به‌راحتی مورد تحلیل واقع شود.

از جمله‌ی این بسته‌های نرم افزار R می‌توان به ابزارهای آماری محاسبه رگرسیون داده‌های مختلف اشاره کرد. در مدل‌های آماری، تحلیل رگرسیون یک فرایند آماری برای تخمین روابط بین متغیرها است. تحلیل رگرسیون کمک می‌کند تا میزان ارتباط متغیرهای وابسته به متغیرهای مستقل پژوهش مشخص شود و فرضیه‌های مورد آزمایش به‌راحتی تحلیل شوند. به‌نوعی باید گفت تحلیل رگرسیون کمک می‌کند تا پیش‌بینی فرضیه‌های مختلف مربوط به متغیرهای وابسته به‌راحتی صورت پذیرد. برای انجام یک تحلیل رگرسیونی ابتدا تحلیل‌گر حدس می‌زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‌زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع‌آوری اطلاعات کمی از دو متغیر می‌پردازد و این داده‌ها را به‌صورت نقاطی در یک نمودار دوبعدی رسم می‌کند.

برای اینکه به زبان ساده‌تر و گویی به زبان یک دانشجوی علوم انسانی بتوانیم رگرسیون را توضیح دهیم کافی ست نمودار زیر را در نظر بگیریم. فرض کنید در نمودار زیر محور x میزان جامعه‌پذیری کارکنان یک سازمان و محور y مقدار مسئولیت‌پذیری سازمانی کارمندان یک اداره‌ی دولتی باشد. در ابتدا یک پژوهنده‌ی علوم اجتماعی فرضیه‌ای مبتنی بر رابطه‌ی مستقیم میان میزان جامعه‌پذیری سازمانی و مسئولیت‌پذیری را مطرح می‌کند.

نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی

در ادامه او باید میزان جامعه‌پذیری را با روش‌های پژوهشی میدانی مانند مصاحبه‌ی حضوری و یا پرسشنامه جمع‌آوری و با دادن میزان نمره‌ی موردنظر به نسبت هر فرد متغیر دیگر که مسئولیت‌پذیری ست را با همان روش‌های پژوهش قبلی اندازه‌گیری کند. با جمع‌آوری داده‌های موردنظر او می‌تواند به راحتی نمودار پخشی داده‌های مختلف را رسم کند. با محاسبات مربوط به رگرسیون خطی او خط آبی را در نمودار زیر رسم می‌کند. این خط نشان‌دهنده‌ی نزدیکی داده‌های مربوط به فرضیه‌ی مطرح‌شده به‌تقریب در نظر گرفته‌شده آماری ست.

  • تحلیل شبکه‌ی اجتماعی در زبان برنامه نویسی R

یکی از روش‌های نوین بررسی داده‌های اجتماعی در پژوهش‌های حوزه‌ی جامعه‌شناسی، استفاده از رسم شبکه‌های ارتباط افراد و یا مفاهیم مختلف است. این روش در واقع برآمده از گراف‌های موجود در علم ریاضیات و پیوند آن با علم آمار و دست آخر پیوند مناسب آن‌ها با علوم اجتماعی است.

مفهوم شبکه‌ی اجتماعی نخستین بار در سال ۱۹۴۰ توسط بروان که یک انسان‌شناس بود معرفی شد.در دهه پنجاه میلادی توسط انسان شناسان اجتماعی دانشگاه منچستر به‌ویژه مورداستفاده قرار گرفت و در دهه ۱۹۶۰ برای توضیح شبکه‌های مدنی آفریقای جنوبی، هندوستان و انگلستان مورداستفاده ویژه قرار گرفت.

تحلیل شبکه‌ها در واقع به ما کمک می‌کند که رابطه‌ها و ارتباط میان داده‌های مختلف را بر اساس مجموعه‌ی داده‌های پژوهشمان تحلیل کرده و آن‌ها را بیابیم. با رشد ارتباط فراگیر اعضای یک جامعه حالا هر ارتباطی می‌تواند نوعی شبکه به حساب آید.

یکی از مثال‌های بارز استفاده از شبکه‌ها، ترسیم شبکه‌های مربوط به ترافیک و یا شبکه‌های مربوط به بازارهای مختلف است. در کنار تحلیل‌های مربوط به ترافیک و بازار، تحلیل‌های مربوط به شبکه‌های اجتماعی نقش پر رنگی در میان پژوهش‌های اجتماعی دارند.

یکی از موفق‌ترین پروژه‌های علوم اجتماعی مطرح در دنیا که از تحلیل شبکه‌های اجتماعی استفاده می‌کند kinderd Britain است که ۳۰ هزار فرد بریتانیایی مختلف با داده‌های مختلف از آن‌ها در این وب‌سایت جمع‌آوری کرده است. این پایگاه داده‌ها شامل داده‌های افراد مختلف از ۱۵۰۰ سال پیش تا به امروز می‌شوند..

ارتباط‌های اجتماعی مختلف در این شبکه می‌تواند بر اساس ارتباط خانوادگی و یا غیر خانوادگی باشد. این وب‌سایت گستره‌ی بزرگی از افراد با مشاغل مختلف را در کنار یکدیگر قرار داده است. داده‌های مختلفی که می‌تواند از میان این شبکه‌های مختلف اجتماعی حاصل آید می‌تواند به بسیاری در فهم ارتباط ژنتیکی مشاهیر مختلف یک سرزمین با دیگر افراد کمک کند.

نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی

تحلیل شبکه‌های اجتماعی در نرم‌افزار و زبان برنامه نویسی R نیز یکی از عمده امکاناتی است که می‌توان از آن برای تحلیل‌های شبکه‌های مختلف استفاده کرد. برای مثال یکی از پژوهش‌های کاربردی مربوط به تحلیل شبکه‌ها با استفاده از متن‌های تولید شده در شبکه‌ی اجتماعی توئیتر، کلمات مهمی که در جستجوهای صورت گرفته توسط کاربران تکرر داشتند را بررسی کرده است. و دسته‌بندی متفاوتی از پیام‌ها با مضمون‌های اجتماعی مربوط به سلامت و یا امنیت شهری را موردبررسی قرار داده و توسط بسته‌های موجود در نرم افزار R به صورت زیر رسم کردند:

نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی

شبکه‌ی ترسیم شده‌ی بالا نشان‌دهنده‌ی مشکلات اشاره‌شده در مورد سلامت عمومی با رنگ قرمز، مشکلات شهرنشینی با رنگی آبی و مشکلات و بحث‌های مربوط به غذا و سلامتی را با رنگ بنفش بر اساس تکرار و تأثیرگذاری کاربران مختلف نشان می‌دهد.

این شبکه‌ی اجتماعی می‌تواند به‌راحتی سوگیری جامعه‌ی نمونه‌ی انتخاب‌شده در هر شبکه‌ی اجتماعی را مورد بررسی قرار دهد و آن را معین کند. بسیاری از پژوهش‌های اجتماعی به دنبال تعیین نیات و غرایز اجتماعی‌ای هستند که به جز استفاده از این روش‌های آماری نمی‌تواند به‌راحتی شناسایی شود و مورد بررسی قرار گیرند.

بنابراین، باید یادآوری کرد که زبان برنامه نویسی R تنها یک بسته‌ی نرم افزاری آماری نیست بلکه یک زبان برنامه‌نویسی کامل است که شباهت بسیاری با انواع زبان‌های برنامه‌نویسی مانند python دارد. در کنار استفاده از این زبان برنامه‌نویسی می‌توان از ویژگی‌های گرافیکی آن بهره‌های زیادی برای نمایش نتایج آماری برد. با وجود قابلیت‌ها و توابع کاربردی بسیار در این نرم‌افزار، وجود زبان برنامه نویسی کمک می‌کند که هر بار بتوان قابلیت‌های خاص موردنیازمان را نوشته و از آن استفاده کنیم.

جامعه‌شناسان راه‌های بسیاری برای استفاده و انتفاع از R دارند. در کنار بسته‌ها و پکیج‌های مخصوص علوم اجتماعی که در این نرم‌افزار ارائه می‌شود، بسته‌های آماری و مدل‌های گرافیکی بسیاری برای نشان دادن شبکه‌های اجتماعی در این نرم‌افزار وجود دارد. این پکیج‌ها می‌توانند توسط افراد زیادی تولید و تهیه گردند و امکانات پژوهشی زیادی را فراهم آورند. از زبان برنامه نویسی R می‌توان همچون SPSS و SAS برای تحلیل‌های مختلف استفاده نمود.

نمایش دادن نتایج در زبان برنامه نویسی R

بازنمایی و نمایش نتایج در R می‌تواند به راحتی توسط بسته‌ها و پکیج‌های گرافیکی صورت گیرد. رسم پلات‌ها و نمودارهای استاندارد از جمله قابلیت‌های از پیش تعیین‌شده‌ی این بستر نرم‌افزاری‌ است؛ رسم هیستوگرام‌ها، نمایش خوشه‌ای، رسم نمودارهای میله‌ای و ستونی، رسم نمودارهای فراوانی، رسم نمودارها و کانتورهای سه‌بعدی و… از جمله نمودار قابل‌استفاده به‌صورت استاندارد در این نرم افزار است.

بسته‌های زیادی در R می‌توانند امکانات دیگری را برای کاربران به همراه بیاورند و از جمله‌ی این امکانات می‌توان به رسم و تولید نمودارهای مختلف آماری برای استفاده در فضای وب و یا در پژوهش‌های علمی اشاره نمود.

نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی

نرم افزار R برای دانشجویان علوم انسانی و علوم اجتماعی

ادامه دارد…


بردار به دنبال معرفی نرم افزارهایی بجز نرم افزارهای تحلیلی معمولِ در علوم انسانی و اجتماعی است تا بتواند در آینده‌ای نزدیک، کارگاره‌هایی در این حوزه برای علاقه‌مندان برگزار کند.

0

افزودن دیدگاه

لطفا دیدگاه خود را بنویسید
لطفا نام خود را وارد کنید

4 × چهار =