چگونه توییتر دانشمندان را به پنجره خوشبختی و سلامتی انسان تبدیل می کند

از زمان راه اندازی عمومی 10 سال پیش، توییتر به عنوان یک پلت فرم شبکه اجتماعی در میان دوستان، سرویس پیام رسانی فوری برای کاربران گوشی های هوشمند و یک ابزار تبلیغاتی برای شرکت ها و سیاستمداران استفاده شده است.

اما این نیز یک منبع ارزشمند داده برای محققان و دانشمندان - مانند من - است که می خواهند مطالعه کنند که چگونه انسان ها در سیستم های پیچیده اجتماعی احساس و عملکرد می کنند.

با تجزیه و تحلیل توییت ها، ما قادر به مشاهده و جمع آوری داده ها در مورد تعاملات اجتماعی میلیون ها نفر "در وحشی"، خارج از آزمایش آزمایش های کنترل شده است.

این ما را قادر ساخت ابزارهایی برای نظارت بر احساسات جمعی جمعیت های بزرگ، پیدا کن خوشبخت ترین مکان ها در ایالات متحده است و خیلی بیشتر.

پس چگونه دقیقا چطور توییتر یک منبع منحصر به فرد برای دانشمندان محاسباتی اجتماعی بود؟ و چه چیزی باعث شده است که ما آن را کشف کنیم؟


گرافیک اشتراک درونی


بزرگترین هدیه توییتر به محققان

در ماه جولای 15، 2006، Twittr (همانطور که در آن زمان شناخته شده بود) عمومی راه اندازی به عنوان یک سرویس تلفن همراه که به گروه های دوستان کمک می کند تا با استفاده از اس ام اس های تصادفی گزاف گویی کنند. توانایی ارسال متون گروهی شخصیت های 140 رایگان، بسیاری از متقاضیان اولیه را به خود اختصاص دادند تا از این پلتفرم استفاده کنند.

با گذشت زمان تعداد کاربران منفجر شد: از 20 میلیون در 2009 به 200 میلیون در 2012 و 310 میلیون امروز. به جای برقراری ارتباط مستقیم با دوستان، کاربران به سادگی به پیروان خود می گویند که چگونه احساس می کنند، به پیام های مثبت یا منفی پاسخ می دهند یا جوک ها را ترک می کنند.

برای محققان، بزرگترین هدیه توییتر، ارائه مقدار زیادی اطلاعات باز است. توییتر یکی از اولین شبکه های بزرگ اجتماعی بود که نمونه های داده ها را از طریق چیزی به نام "برنامه های کاربردی برنامه های کاربردی" (APIs)، که محققان را قادر به پرس و جو از توییتر برای انواع خاص توییت (به عنوان مثال، توییت هایی که حاوی کلمات خاصی هستند) .

این به انفجار پروژه های تحقیقاتی منجر شد که از این داده ها استفاده کنند. امروزه جستجوی Google Scholar برای توییتر شش میلیون بازدید کننده را در مقایسه با پنج میلیون برای «فیس بوک» تولید می کند. این تفاوت به ویژه با توجه به اینکه فیس بوک تقریبا پنج بار به عنوان بسیاری از کاربران به عنوان توییتر (و دو سال بزرگتر است).

سیاست های داده های سخاوتمند توییتر بدون شک منجر به تبلیغ تبلیغاتی بسیار خوبی برای این شرکت شد، زیرا مطالعات علمی جالب توسط رسانه های اصلی به دست آمد.

مطالعه خوشبختی و سلامت

با اطلاعات سرشماری سنتی، جمع آوری داده های آهسته و گرانبها، فید داده های باز مانند توییتر، امکان ارائه یک پنجره زمان واقعی را برای مشاهده تغییرات در جمعیت های بزرگ فراهم می کند.

دانشگاه ورمونت آزمایشگاه داستان محاسباتی در 2006 تاسیس شد و مشکلات مربوط به ریاضیات کاربردی، جامعه شناسی و فیزیک را مورد مطالعه قرار داد. از آنجا که 2008، آزمایشگاه داستان میلیون ها تویت را از خوراک "Gardenhose" توییتر جمع آوری کرده است، API که یک نمونه تصادفی از 10 درصد از همه تویت های عمومی را در زمان واقعی جریان می دهد.

من سه سال در آزمایشگاه محاسبات داستان صرف کردم و خوش شانس بودم که بخشی از مطالعات جالب توجه با استفاده از این داده ها باشد. به عنوان مثال، ما توسعه یک هدیومتر که شادی Twittersphere را در زمان واقعی اندازه گیری می کند. با تمرکز بر توییت های geolocated فرستاده شده از گوشی های هوشمند، ما توانستیم نقشه خوشبخت ترین مکان ها در ایالات متحده است. شاید ناامید کننده باشد، ما متوجه شدیم هاوائی به عنوان خوشبخت ترین کشور و نوشیدنی شراب، شادترین شهر است برای 2013. 

یک نقشه از 13 میلیون توطئه جغرافیایی ایالات متحده از 2013 که با خوشحالی رنگ آمیزی شده است، با نشانگر خوشبختی قرمز و ناراحتی آبی نشان می دهد. PLOS ONE، نویسنده ارائه شده استیک نقشه از 13 میلیون توطئه جغرافیایی ایالات متحده از 2013 که با خوشحالی رنگ آمیزی شده است، با نشانگر خوشبختی قرمز و ناراحتی آبی نشان می دهد. مجله PLOS ONE، نویسنده ارائه شده است.این مطالعات کاربردی عمیق تر داشت: همبستگی استفاده از کلمات توییتر با جمعیت شناسی به ما در درک الگوهای اساسی اجتماعی-اقتصادی در شهرهای کمک کرد. به عنوان مثال، ما می توانیم استفاده از کلمات را با عوامل سلامت مانند چاقی پیوند دهیم، بنابراین ما ساخته ایم lexicocalorimeter برای اندازه گیری محتوای "کالری" پست های رسانه های اجتماعی. تویت از منطقه خاصی که غذاهای پر کالری را ذکر کرد، محتوای "کالری" آن منطقه را افزایش داد، در حالیکه توییت هایی که ذکر شد، فعالیت های ورزش کاهش یافته است. ما متوجه شدیم که این اندازه ساده است با سایر معیارهای بهداشت و سلامت همبستگی دارد. به عبارت دیگر، توییت ها توانستند یک لحظه تصویری را در لحظه خاصی از سلامت کلی یک شهر یا منطقه به ما بدهند.

با استفاده از ثروت اطلاعات توییتر، ما نیز توانستیم الگوهای رفتاری روزانه مردم را در جزئیات بی نظیر ببینید. درک الگوهای تحرک انسانی، به نوبه خود، توانایی تغییر مدل سازی بیماری ها، باز کردن زمینه جدید از اپیدمیولوژی دیجیتالی.

برای مطالعات دیگر، ما بررسی کردیم که آیا مسافران در توییتر شادمانی بیشتری نسبت به کسانی که در خانه باقی می مانند (جواب: آنها) را نشان می دهند و اگر افراد خوشحال در شبکه اجتماعی همدیگر را می پوشند (دوباره آنها را انجام می دهند). در واقع، مثبت بودن به نظر می رسد به زبان خود پخته شده است، به این معنا که ما کلمات مثبت بیشتری نسبت به کلمات منفی داریم. این فقط در توییتر نبود بلکه در میان انواع رسانه های مختلف (مانند کتاب ها، فیلم ها و روزنامه ها) و زبان ها بود.

این مطالعات - و هزاران نفر دیگر مانند آنها را از سراسر جهان - تنها با تشکر از توییتر امکان پذیر بود.

سال 10 بعدی

پس چه می توان انتظار داشت که از توییتر در سال 10 بعدی یاد بگیریم؟

بعضی از هیجان انگیز ترین کارها در حال حاضر شامل اتصال داده های رسانه های اجتماعی با مدل های ریاضی برای پیش بینی پدیده های سطح جمعیت مانند شیوع بیماری است. محققان در حال پیشرفت در مدل های بیماری با داده های توییتر برای پیشگویی آنفلوآنزا، به ویژه در مورد آن، موفق بوده اند FluOutlook پلت فرم توسعه یافته توسط دانشگاه شمال شرقی و موسسه تبادل علمی است.

با این حال، شماری از چالش ها باقی می مانند. داده های رسانه های اجتماعی از یک نسبت "نسبت سیگنال به نویز" بسیار پایین رنج می برند. به عبارت دیگر، توییت هایی که مربوط به یک مطالعه خاص هستند اغلب توسط "سر و صدا" نامناسب غرق می شوند.

بنابراین، ما باید به طور مداوم از آنچه که خوانده شده است آگاهی داشته باشد "داده بزرگ hubris"در حال توسعه روش های جدید و نه بیش از حد از نتایج ما. در این ارتباط باید هدف تولید پیش بینی های "جعبه شیشه ای قابل تفسیر" از این داده ها (به عنوان مخالف پیش بینی های "سیاه جعبه"، که در آن الگوریتم پنهان یا روشن نیست) باشد.

داده های رسانه های اجتماعی اغلب (نسبتا) از نظر کوچک بودن، نمونه غیر نماینده از جمعیت گسترده تر. یکی از چالش های عمده برای محققان، شناخت این است که چگونه چنین داده هایی را در مدل های آماری حساب کند. در حالی که مردم هر ساله از رسانه های اجتماعی استفاده می کنند، ما باید همچنان سعی کنیم تا این گونه اطلاعات را درک کنیم. به عنوان مثال، داده ها همچنان تمایل دارند که افراد جوانتر را در هزینه های جمعیت های مسن تر نشان دهند.

تنها پس از توسعه روشهای اصلاح تعصب بهتر، محققان قادر خواهند بود پیش بینی های کاملا مطمئن از توییت ها را ایجاد کنند.

درباره نویسنده

لوئیس میچل، مدرس ریاضیات کاربردی دانشگاه آدلاید

این مقاله در اصل در تاریخ منتشر شد گفتگو. دفعات بازدید: مقاله.

کتاب های مرتبط

at InnerSelf Market و آمازون