چگونه کامپیوترها به بیولوژیست کمک می کنند اسرار زندگی را از بین ببرند

هنگامی که ژنوم انسانی سه میلیارد ساله دنباله دار شد، ما به یک "omics"دوران تحقیقات بیولوژیک. دانشمندان در حال حاضر برای پیگیری ژن ها (همه ژن ها) یا پروتئوم ها (همه پروتئین ها) از ارگانیزم های مختلف مسابقه می دهند و در این فرایند مقدار زیادی اطلاعات را جمع می کنند.

به عنوان مثال، یک دانشمند می تواند از ابزارهای "omics" مانند توالی DNA استفاده کند تا کسی که ژن های انسانی در یک عفونت ویروسی آنفلوآنزا مبتلا به آنتی بیوتیک شده است. اما به دلیل اینکه ژنوم انسان حداقل ژنهای 25,000 را در مجموع دارد، تعداد ژنها حتی تحت چنین سناریویی ساده تغییر می کند، به طور بالقوه ممکن است در هزاران نفر باشد.

گرچه توالی و شناسایی ژن ها و پروتئین ها به آنها نام و مکان می دهد، اما به ما نمی گوید که چه کار می کنند. ما باید بدانیم که چگونه این ژن ها، پروتئین ها و همه چیز در میان در فرآیندهای بیولوژیکی مختلف ارتباط برقرار کنید.

امروزه حتی آزمایش های پایه داده های بزرگی را تولید می کنند و یکی از بزرگترین چالش ها نتایج مربوط به سر و صدای پس زمینه است. کامپیوترها به ما کمک می کنند تا این کوه داده را غلبه کنیم؛ اما آنها حتی می توانند یک قدم بیشتر از آن را پیش ببرند، به ما کمک می کند تا با فرضیه های علمی و فرآیندهای زیست شناختی جدیدی آشنا شویم. علم داده، اساسا، امکان تحقیق بیولوژیکی برش لبه را فراهم می کند.

کامپیوترها برای نجات

کامپیوترها به طور مجزا برای اداره مجموعه داده های عظیم واجد شرایط هستند، زیرا آنها می توانند به طور همزمان تمامی شرایط مهم مورد نیاز برای تجزیه و تحلیل را پیگیری کنند.


گرافیک اشتراک درونی


اگرچه آنها می تواند خطاهای انسانی را منعکس کند آنها با برنامه ریزی شده اند، کامپیوتر ها می توانند مقادیر زیادی داده را با کارآیی مقابله کنند و به سمت آشنا به عنوان محققان انسانی متوسل نشوند.

رایانه ها همچنین می توانند به دنبال الگوهای خاصی در مجموعه داده های تجربی باشند - یک مفهوم به نام یادگیری ماشین، اولین بار در 1950s پیشنهاد شده، بیشتر به ویژه توسط ریاضیدان آلن تورینگ. الگوریتمی که الگوها را از مجموعه داده ها آموخته است می تواند از آن خواسته شود پیش بینی ها براساس داده های جدیدی که قبلا با آنها مواجه نشده است، ایجاد شود.

یادگیری ماشین موجب تحول در تحقیقات بیولوژیک شده است؛ زیرا ما اکنون می توانیم از مجموعه داده های بزرگ استفاده کنیم و از رایانه ها برای کمک به درک زیست شناسی پایه استفاده کنیم.

آموزش کامپیوترها با شبیه سازی پروسه های مغز

ما از یک نوع جالب از یادگیری ماشین استفاده کرده ایم، به نام یک شبکه عصبی مصنوعی (ANN)، در آزمایشگاه خودمان است. مغزها شبکه های بسیار متصل به نورون هستند که با ارسال پالس های الکتریکی از طریق سیم کشی عصبی ارتباط برقرار می کنند. به همین ترتیب ANN یک شبکۀ عصبی را در رایانه شبیه سازی می کند، چرا که در پاسخ به سیگنال های دیگر نورون ها روشن و خاموش می شود.

با استفاده از الگوریتم هایی که فرآیندهای نورون های واقعی را تقلید می کنند، می توانیم شبکه را برای حل انواع انواع مشکلات حل کنیم. گوگل با استفاده از ANN قدرتمند خود را در حال حاضر معروف است پروژه عمیق دره جایی که کامپیوترها می توانند تصاویر را طبقه بندی و حتی ایجاد کنند.

گروه ما با بررسی اهداف سیستم ایمنی بدن را بررسی می کند بدست آوردن درمان های جدید برای سرطان. ما از مدل های محاسبات ANN برای بررسی سطح پروتئین سطحی استفاده کردیم که از سلول های ایمنی بدن ما برای تعیین اینکه آیا چیزی خارج از بدن ما است و بنابراین باید مورد حمله قرار گیرد. اگر ما بیشتر در مورد چگونگی تفکیک سلول های ایمنی بدن (مانند سلول های T) بین طبیعی / خود و سلول های غیر طبیعی / خارجی تفکیک کنیم، می توانیم واکسن ها و درمان های بهتر را طراحی کنیم.

ما کاتالوگ های عمومی موجود در هزاران پروتئین کدهای شناسایی شده توسط محققان را در طول سال ها ریخت. ما این اطلاعات بزرگ را به دو تقسیم کردیم: کدهای پروتئین خود پروتئینی حاصل از سلول های سالم انسان و کد های پروتئینی غیرطبیعی حاصل از ویروس ها، تومورها و باکتری ها. سپس ما به یک شبکه عصبی مصنوعی توسعه یافته در آزمایشگاه ما تبدیل شدیم.

الگوریتم قادر به شناسایی آن بود. هنگامی که پروتئین کدی را به ANN وارد کردیم تفاوت های اساسی بین کدهای پروتئینی عادی و غیر طبیعی. برای کسانی که این گونه پدیده های بیولوژیکی را دنبال می کنند، دشوار خواهد بود - هزاران کدهای پروتئینی برای تجزیه و تحلیل در مجموعه داده های بزرگ وجود دارد. این دستگاه برای حل این مشکلات پیچیده و تعریف زیست شناسی جدید نیاز دارد.

پیش بینی ها از طریق یادگیری ماشین

مهمترین کاربرد یادگیری ماشین در زیست شناسی، کاربرد آن در ایجاد پیش بینی ها بر اساس داده های بزرگ است. پیش بینی های مبتنی بر کامپیوتر می توانند اطلاعات بزرگ، فرضیه های آزمون و صرفه جویی در زمان و منابع ارزشمند را درک کنند.

به عنوان مثال، در زمینه زیست شناسی سلول های T، دانستن کدام پروتئین ویروسی برای هدف در توسعه واکسن ها و درمان ها بسیار مهم است. اما بسیاری از پروتئین های فردی از هر گونه ویروس داده شده وجود دارد که بسیار گران است و به لحاظ آزمایشی هر یک از آن ها دشوار است.

در عوض، ما شبکه عصبی مصنوعی را آموزش دادیم تا به ماشین کمک کند همه ویژگی های بیوشیمیایی مهم دو نوع پروتئین کدهای - طبیعی و غیر طبیعی را یاد بگیرد. سپس از مدل خواسته شد تا "پیش بینی" که کدام پروتئین جدید پروتئین ویروسی مشابه رده "غیر طبیعی" است و می تواند توسط سلول های T و به این ترتیب سیستم ایمنی دیده شود. ما مدل ANN را بر روی پروتئین های مختلف ویروسی که قبلا مورد مطالعه قرار نگرفته اند، مورد آزمایش قرار دادیم.

مطمئنا به اندازه کافی، مانند یک دانش آموز سختگیر که مشتاق است تا معلم را بپوشاند، شبکه عصبی قادر به دقت شناسایی اکثر پروتئین های کد کننده فعال T-cell در این ویروس بود. ما همچنین آزمایش های کدهای پروتئینی را که مورد تأیید صحت پیش بینی های ANN قرار داشت نشان دادیم. بنابراین دانشمند می تواند با استفاده از این مدل شبکه عصبی به سرعت در حال پیش بینی تمام پروتئین های مهم کوتاه مدت از یک ویروس مضر و آزمایش آنها را برای توسعه یک یا یک واکسن، به جای حدس زدن و آزمایش آنها به صورت جداگانه.

پیاده سازی آموزش ماشین هوشمندانه

با توجه به پالایش مداوم، علم اطلاعات بزرگ و یادگیری ماشین به طور فزاینده ای برای هر نوع پژوهش علمی ضروری است. امکانات استفاده از رایانه برای آموزش و پیش بینی در زیست شناسی تقریبا بی پایان است. از درک اینکه ترکیبی از نشانگرهای بیولوژیک برای تشخیص یک بیماری برای درک دلیل، بهتر است برخی از بیماران از یک درمان خاص سرطان بهره مند می شوند، جمع آوری داده های بزرگ داده ها با استفاده از رایانه ها، یک مسیر ارزشمند برای تحقیق است.

البته محدودیت وجود دارد. بزرگترین مشکل با علم داده بزرگ این است که داده ها خودشان هستند. اگر داده های به دست آمده از مطالعات -omics برای شروع نادرست باشد، یا براساس علم فاسد، دستگاه ها بر روی داده های بد آموزش داده می شوند - که منجر به پیش بینی های ضعیف. دانش آموز تنها به عنوان معلم خوب است.

از آنجا که کامپیوترها حساس نیستند (هنوز)، آنها می توانند در تلاش برای الگوهای آنها حتی با وجود آنکه هیچ کدام وجود نداشته باشند، دوباره رشد می کنند، به اطلاعات بد و علمی غیر قابل توصیف می رسند.

و بعضی از محققان نگرانی های خود را پیرامون رایانه تبدیل کرده اند جعبه سیاه داده برای دانشمندان که به وضوح نمی دانند دستکاری ها و ماخیزی که آنها انجام می دهند از طرف آنها.

به رغم این مشکلات، مزایای استفاده از داده های بزرگ و ماشین آلات همچنان به شرکای ارزشمند خود در تحقیقات علمی کمک خواهد کرد. با توجه به هشدارها، ما به طرز منحصر به فردی برای درک زیست شناسی از طریق چشم یک دستگاه هستیم.

درباره نویسندهگفتگو

سیر کریشنا، دانشجوی دکتری، طراحی زیست شناسی، دانشکده مهندسی سیستم های زیست شناسی و بهداشت، دانشگاه ایالتی آریزونا و دیگو چول، دانشجوی دکتری ریاضیات کاربردی، دانشگاه ایالتی آریزونا

این مقاله در اصل در تاریخ منتشر شد گفتگو. دفعات بازدید: مقاله.


کتاب های مرتبط:

at InnerSelf Market و آمازون