نام پژوهشگر: فاطمه زاهدی براشکی

پیشگویی نوع پیچ های بتا (β-turns) در پروتئین با استفاده از مدل آماری lda و شبکه عصبی مصنوعی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم پایه 1388
  فاطمه زاهدی براشکی   پرویز عبدالمالکی

پیشگویی ساختار دوم پروتئین مرحله ای حد واسط در پیشگویی ساختار سوم با استفاده از توالی اسیدآمینه های پروتئین می باشد. از آنجا که پیچ بتا جزیی بسیار مهم از ساختار دوم پروتئین است. بنابراین پیشگویی پیچهای بتا و انواع آنها برای پیشگویی ساختار دوم ضروری می باشد. هدف از این مطالعه، پیشگویی انواع پیچهای بتا با استفاده از مدل ترکیبی دو مرحله ای شامل روش آماری آنالیز ممیزی خطی و روش غیرخطی شبکه عصبی مصنوعی می باشد. آنالیز ممیزی خطی برخلاف شبکه عصبی، توانایی تشخیص پارامترهای ساختاری موّثر در پیشگویی دقیق پیچهای بتا را دارا می باشد. بانک پروتئینی استفاده شده در این مطالعه حاوی 565 زنجیره پروتئینی غیر همولوگ است که با استفاده از سیستم papia تهیه شده است.پارامترهای ساختاری مورد استفاده در این پیشگویی درصدهای وجود 20 نوع اسید آمینه در موقعیتهای i+3 ,i+2 ,i+1 ,i می باشند. در مرحله اول مدل آنالیز ممیّزی خطی پس از آنالیز 100 پارامتر ساختاری داده شده به آن، 40 پارامتر را به عنوان پارامترهای موثر در طبقه بندی انتخاب کرد. پارامترهای ساختاری انتخاب شده توسط این مدل به عنوان ورودیهای شبکه عصبی استفاده شدند. شبکه عصبی مورد استفاده حاوی سه لایه ورودی، میانی و خروجی با الگوریتم آموزش کواسی نیوتن میباشد. ساختار شبکه عصبی پس از انجام مراحل بهینه سازی به اینصورت طراحی شد که: برای لایه ورودی 40 نرون، برای لایه میانی 15 نرون و برای لایه خروجی 5 نرون در نظر گرفته شد. الگوهای تعیین شده برای انواع ns، i، ii، viii و iv به ترتیب عبارتند از: 10000، 01000، 00100، 10 و 1 . پیشگویی با شبکه عصبی مقادیر mcc و دقت پیشگویی زیر را برای پنج کلاس پیچ بتا ارائه کرد. مقادیر mcc برای کلاس i، 273/0، برای کلاس ii، 475/0، برای کلاس iv، 130/0، برای کلاس viii، 178/0 وبرای کلاس ns، 248/0 می باشد. مقادیر دقت پیشگویی برای کلاسهای,i ، ii، iv ، viii و ns به ترتیب عبارتند از: 1/69، 2/89، 6/53، 3/88 و 8/91. مقادیر mcc برای کلاسهای i و iv وviii و همچنین دقت پیشگویی برای کلاسهای i و ns، نسبت به روش مورد مقایسه(مدل ترکیبی شامل مولتی نومیال لجستیک رگرسیون و شبکه عصبی مصنوعی) بهبود یافته اند. دیگر مقیاسهای کارایی مدل (حساسیت، ویژگی و احتمال پیشگویی صحیح) نیز برای ارزیابی مورد استفاده قرار گرفتند. در نهایت مدل ترکیبی دو مرحله ای برای پیشگویی صحیح پنج نوع پیچ بتا با دقت بالا معرفی شد، که نسبت به مدل مورد مقایسه بسیار ساده تر و با صرف زمان و هزینه ای کمتر قابل اجرا می باشد.