پیش بینی ساختارهای دوم و سوم پروتئین با کمک روش های یادگیری ماشین

پایان نامه
چکیده

مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی ساختارهای پروتئین از جمله مسائل چالش برانگیزی است که در طی 35 سال گذشته محققان بسیاری در سراسر دنیا در این زمینه تحقیق کرده اند. اکثر ساختار و عملکرد سلول ها توسط پروتئین ها تعیین می شوند. عملکرد یک پروتئین توسط ساختار آن تعیین می شود. اما به دست آوردن و تعیین ساختار پروتئین کاری مشکل می باشد. برای به دست آوردن ساختار پروتئین از روی دنباله اسید های آمینه آن نیاز به روش های محاسباتی سنگینی می باشد. امروزه به کارگیری علوم مهندسی برای حل مسائل حوزه علوم زیستی و پزشکی به سرعت و با موفقیت رو به افزایش است، بنابراین بسیاری از دانشمندان علوم کامپیوتر به این سمت گرایش پیدا کرده اند تا بتوانند از روش های مختلف یادگیری ماشین در پیاده سازی سیستم های خودکار هوشمند به منظور دسته بندی پروتئین ها کمک بگیرند. هدف نهایی در ساخت این سیستم ها، نزدیک بودن هر چه بیشتر تصمیم اتخاذ شده توسط ماشین به تصمیم فرد خبره زیست شناس می باشد. دقت روش های یادگیری ماشین برای پیش بینی ساختار دوم و سوم (تاخوردگی) پروتئین به ترتیب حدود 80% و 60% می باشد و محققان در تلاش هستند که بتوانند با استفاده از روش های یادگیری ماشین این دقت را افزایش دهند. در این پژوهش ابتدا به بررسی ساختار دوم و تاخوردگی پروتئین پرداخته و سپس با استفاده از چندین روش مبتنی بر روش های یادگیری ماشین (ماشین بردار پشتیبان، شبکه عصبی و c4.5)، تلاش کردیم ساختارهای پروتئین را با دقت قابل قبولی پیش بینی کنیم. با بهینه سازی پارامتر های ماشین بردار پشتیبان و ترکیب کرنل های آن، دقت پیش بینی ساختار دوم پروتئین در مقایسه با سایر روش ها حدود 2% بهبود داشت. همچنین در ساختار سوم پروتئین با بهبود روش های بردار پشتیبان و شبکه های عصبی و سپس ترکیب این دو روش، دقت یادگیری نسبت به سایر روش ها حدود 3% بهبود یافت.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیش بینی برهم کنش های پروتئین-پروتئین مبتنی بر ساختار اول با کمک روش های یادگیری ماشین

مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی برهم کنش های پروتئین-پروتئین یک مسئله مهم در بیوانفورماتیک و سیستم های زیستی به حساب می آید. در حقیقت استخراج برهم کنش های میان پروتئین ها برای ساختن شبکه های برهم کنشی پروتئینی ضروری می باشد. این شبکه ها نقش مهمی در شناخت اکثر فرایندهای زیستی دارند. در سال های اخیر، از روش های آزمایشگاهی با توان عملیاتی بالا برای کشف برهم کنش های پروتئین...

15 صفحه اول

پیش بینی عملکرد پروتئین ها مبتنی بر روشهای یادگیری ماشین

با شناسایی کامل دنباله های پروتئینی در برخی از موجودات زنده همچون انسان، دوره جدیدی در علم زیست شناسی و علوم مرتبط آغاز گردید. هدف اصلی در این دوره، شناسایی عملکرد پروتئین های بی-شماری است که دنباله و ساختار آن ها به طور کامل شناسایی شده است، اما از عملکرد قطعی آن ها اطلاعات دقیقی در دسترس نیست. با توجه به نقش وکارکرد حیاتی پروتئین ها در بسیاری از فعالیت های حیاتی موجودات زنده، مطالعه و تعیین ع...

پیش بینی ظرفیت برش پانچ دال های بتنی مسلح شده با FRP به کمک ماشین بردار پشتیبان (SVM)

در سال های اخیرکامپوزیت های FRP به علت داشتن نسبت های بالای مقاومت به وزن و سختی به وزن، پتانسیل بالای دوام و وزن پایین بطور گسترده ای استفاده شده اند؛ همچنین استفاده از میلگردهای FRP در جایی که احتمال خوردگی آرماتورهای فولادی وجود دارد، جایگزین مناسب برای تقویت دال های بتنی می باشد. تا کنون روابط تجربی زیادی برای تخمین ظرفیت برشی دال های بتنی ارائه شده است اما در مسائل متنوعی، روش های داده کاو...

متن کامل

مدل های یادگیری ماشین برای پیش بینی تشخیص بیماری کبد

سابقه و هدف: کبد مهم ترین ارگان داخلی بدن می باشد که نقش اصلی در متابولیسم بدن دارد. بیماری کبد را نمی توان به راحتی در مراحل اولیه کشف کرد زیرا کبد حتی زمانی که قسمتی از آن نیز آسیب دیده باشد به درستی کار می کند و این خود تشخیص این بیماری را مشکل می کند. ابزارهای طبقه بندی اتوماتیک به عنوان یک ابزار کمک تشخیص باعث کاهش بار کاری پزشکان می گردد. طبقه بندی هایی که به منظور تشخیص هوشمند بیماری کبد...

متن کامل

پیش بینی نقشه تماس پروتئین توسط روش ماشین گروهی

بیوانفورماتیک علمی است بین رشته ای که قواعد ریاضی، فیزیک، شیمی و علوم کامپیوتر را به داده های وسیع، متنوع و پیچیده زیست شناسی، اعمال می کند. هدف بیوانفورماتیک، حل مسایل زیست شناسی در سطح مولکولی است. پروتیین ها از اجزای اصلی سلول های موجودات زنده هستند. هر مولکول پروتیین، از زنجیره ای از اسیدهای آمینه تشکیل می شود. برای پروتیین چهار ساختار (اول، دوم، سوم، چهارم) تعریف شده است. ساختار اول، همان ...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023