نام پژوهشگر: آتوسا مددکار سبحانی

به کارگیری الگوریتم رندم فارست به منظور تشخیص اثرهای متقابل پلی مورفیسم های تک نکلئوتیدی در داده های ژنتیکی و مقایسه عملکرد آن با سایر روش های یادگیری ماشینی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علوم بهزیستی و توانبخشی - پژوهشکده آمار 1392
  آتوسا مددکار سبحانی   مسعود کریملو

پلی مورفیسمهای تک نکلئوتیدی گوناگونی ژنتیکی در طول ژنوم می باشند که حداقل در یک درصد از جمعیت رخ می دهند. پژوهشگران معتقدند که نقشه های پلی مورفیسم تک نکلئوتیدی، آن ها را در یافتن ژن های موثر در ابتلا به بیماری های پیچیده ای از جمله: بیماری های قلبی-عروقی، دیابت و سرطان ها کمک شایانی خواهد نمود. هنگام بررسی همزمان چندین پلی مورفیسم تک نکلئوتیدی در بیماری شایع معمولاً نقش هر پلی مورفیسم تک نکلئوتیدی آنقدر کوچک است که این تأثیر با روش های کلاسیک آماری قابل تشخیص نمی باشند؛ از طرف دیگر بسیاری از این اثرات به صورت ضربی با بیماری مورد نظر ارتباط دارند (اثر متقابل هر پلی مورفیسم با پلی مورفیسم دیگر یا اثر متقابل هر پلی مورفیسم با عوامل محیطی) و این امر تشخیص پلی مورفیسم های مرتبط با بیماری و در نتیجه تعیین پیش آگاهی ابتلا به بیماری را مشکل می سازد. روش های یادگیری ماشینی با استفاده از اطلاعات مجموعه آموزشی یا یادگیری، پیش بینی های آینده را بر اساس الگو یا قواعد یاد گرفته شده انجام می دهند. این روش ها در دهه اخیر، یکی از روش های مرجع در تحلیل پلی مورفیسم های تک نکلئوتیدی به شمار می روند. از طرفی روش های یادگیری ماشینی بر مبنای درخت نه تنها تفسیر ساده ای دارند، توانایی تحلیل همزمان پلی مورفیسم های تک نکلئوتیدی را نیز دارند. در این مطالعه از داده های مرتبط با پلی مورفیسم های تک-نکلئوتیدی در پیش بینی ابتلا به بیماری شریان های کرونری استفاده شد. در این مطالعه ارتباط پلی مورفیسمهای تک نکلئوتیدی در دو ژن ldlr و pcsk9 با بیماری شریان های کرونری مورد بررسی قرار گرفت. هدف مطالعه، تشخیص پلی مورفیسم های تک نوکلئوتیدی تاثیرگذار با استفاده از الگوریتم های رندم فارست و درخت کلاس بندی-رگرسیونی بوده؛ در ضمن این دو الگوریتم در نحوه عملکرد پیش بینی خود مقایسه گردیدند. با توجه به آمار مرگ و میر و ناتوانی ناشی از شریان های کرونر، امکان غربالگری و تشخیص افرادی که از نظر ژنتیکی مستعد این بیماری باشند، می تواند در کاهش هزینه های درمان از مسیر پیشگیری و کنترل بروز بیماری در افراد با خطر بالا تأثیرگذار باشد. با توجه به مدل پیشنهادی، می توان با کنترل عوامل محیطی خطرزا موجب کاهش بروز بیماری در افراد سالمی که دارای استعداد ژنتیکی ابتلا به بیماری تشخیص داده می شوند، شد. این مدل اثرات متقابل میان پلی مورفیسم ها را نیز به ترتیب توالی که در درخت آمده اند، مشخص نمود. این مطالعه یکی از نخستین مطالعات بر مبنای مقایسه روش های یادگیری ماشینی در مطالعات ژنتیکی است. در پژوهش حاضر، درخت کلاس بندی-رگرسیونی عملکرد نسبتا بهتری در ارائه پیش آگهی در بیماری شریان های کرونر نشان داد. این روش نه تنها پلی مورفیسم های تأثیرگذار در بیماری مورد نظر را معرفی می نماید، بلکه مدل درختی را برای طبقه بندی افراد به افراد مستعد به بیماری و افراد با خطر کمتر در مواجه به این بیماری معرفی می نماید. هرچند که تشخیص پلی مورفیسمهای تاثیرگذار توسط مدل، محققان را در یافتن پلی مورفیسم های مرتبط با بیماری شریان های کرونری کمک می نماید، اما مدل پیش بینی معرفی شده نیازمند بررسی های بیشتر است و تعمیم نتایج به صورت کلی کاوش های بیشتر را در این زمینه می طلبد.