نام پژوهشگر: رضا ظهوری آرام

تشخیص تاخوردگی پروتئین با استفاده از یک رویکرد دسته بندی دو لایه
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر 1393
  رضا ظهوری آرام   نصرالله مقدم چرکری

پروتئین¬ها از حیاتی¬ترین ماکرو مولکول¬ها در طبیعت هستند که کلیه اعمال موجود زنده به عملکرد آن ها بستگی دارد. پروتئین¬ها در سوخت و ساز سلول¬ها و رشد و ترمیم بدن نقش بسیار مهمی دارند. تمام آنزیم¬هایی که در بدن باعث انجام واکنش¬های مختلف می¬شوند از جنس پروتئین هستند. پروتئین¬ها ساختاری سلسله مراتبی دارند که شامل چهار ساختار اول، دوم، سوم و چهارم می¬باشد. پیش¬بینی ساختار پروتئین¬ها از روی توالی اولیه¬شان در بیوانفورماتیک بسیار مهم است. منظور از توالی اولیه در حقیقت همان ساختار اول پروتئین است که به صورت آزمایشگاهی به دست می آید. از آنجا که ساختار سوم پروتئین تعیین کننده نحوه عمل آن است، بنابراین شناخت ساختار آن برای شناسایی عملکرد یک پروتئین ضروری است. از طرفی شناسایی این ساختار در طراحی داروها نیز بسیار موثر است. برای شناسایی ساختار سوم پروتئین نیازمند تشخیص تاخوردگی پروتئین هستیم. تاخوردگی پروتئین که یکی از بزرگترین چالش¬ها در بیوانفورماتیک است به معنی به دست آوردن ساختار سوم یک توالی پروتئین داده شده بدون تمرکز بر شباهت توالی¬ها است. به دلیل پر هزینه بودن روش¬های آزمایشگاهی، از روش¬های محاسباتی برای تعیین ساختار سوم پروتئین کمک می¬گیرند. در این پژوهش نیز با استفاده از روش¬های محاسباتی و به کمک الگوریتم¬های یادگیری ماشین به پیش¬بینی تاخوردگی پروتئین پرداخته¬ایم. به این منظور یک چارچوب دسته¬بندی دو لایه برای تشخیص تا خوردگی پروتئین ارائه شده است. در لایه اول از این چارچوب، چهار دسته ساختاری پروتئین¬ها که شامل α، β ، α/β و α+β است، شناسایی می¬شود. سپس نتایج پیش بینی لایه اول به عنوان ویژگی¬های جدید به مجموعه داده¬ اضافه می¬شود. در نهایت در لایه دوم با استفاده از یک دسته بند دیگر تاخوردگی¬های پروتئین پیش¬بینی می¬شود. با تکیه به همین چارچوب چندین مدل مختلف برای حل مسئله پیشنهاد شده و نتایج خوبی نیز در مقایسه با دیگران حاصل شده است. نتایج آزمایشات روی مجموعه ویژگی¬های دینگ و دوبچاک نشان می¬دهد که حدود 2 تا 14 درصد بهبود دقت نسبت به پژوهش¬های قبلی حاصل شده است.