رتبه بندی و انتخاب توصیفگرهای متعامد در qsar با استفاده از جک نایف و روشهای مبتنی بر پخش

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده شیمی
  • نویسنده نعمت اله امیدی کیا
  • استاد راهنما محسن کمپانی زارع
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1389
چکیده

بخش اول این بخش شامل اجرای یک روش انتخاب متغیر با استفاده از روش جک نایف بر روی توصیفگرهای متعامد شده با استفاده از روش gram-schmidtاست. در این مطالعه از دادهی سلوود که دارای 31 مولکول و 53 توصیفگر است استفاده شده است. از دو روش رگرسیون: رگرسیون چند متغیره و همچنین pls در ساختن مدل و انتخاب متغیر در داخل جک نایف استفاده شده است. و نتایج نشان از عملکرد بهتر pls چه با داده ی هم مقیاس و چه با داده ی متعامد دارد. در ابتدا تعداد توصیفگرها با استفاده از روش gram-schmidt به30 کاهش می یابد. مجموعه ی توصیفگرهای بدست آمده با استفاده از جک نایف بر مبنای plsدارای تکرار پذیری بسیار خوبی نسبت به حالت مشابه و استفاده از داده های هم مقیاس هستند. برای تعیین توصیفگرهای معنی دار از یک تست-t استفاده می شود. که بر روی پخش توصیفگرهای بدست آمده از جک نایف عمل می کند. در این مطالعه با تغییر اندازه ی مجموعه ی کالیبراسیون در جک نایف اقدام به رتبه دار کردن توصیفگرها شده است. به این ترتیب که با تغییر اندازه ی این مجموعه، توصیفگرها یکی یکی و بر حسب محتوای اطلاعاتشان وارد مدل می شوند. تعداد توصیفگرهای معنی دار کاملا وابسته ی اندازه ی نمونه ها در جک نایف است. در ادامه پارامترهای مدل نظیر: اندازه ی مجموعه ای که برای ساخت مدل استفاده می شود، تعداد دفعاتی که داده به دو بخش کالیبراسیون و ارزشگذاری تقسیم می شود، تعداد فاکتورهای pls و همچنین بردار آغازگر عملیات تصویر سازی در gram-schmidt بهینه می شوند. و در پایان با استفاده از روش جک نایف بر مبنای pls در شرایط بهینه 5 توصیفگر انتخاب می شود، و پارامترهای مدل نهایی بسیار تکرار پذیر و قابل مقایسه با مدل ها و روش های انتخاب متغیر دیگر است و قدرت پیش بینی مدل 0.693q2tot = و همچنین 0.811 = r2 است. بخش دوم این بخش شامل اجرا و مقایسه ی روش های انتخاب متغیری است که بر مبنای پخش عمل می کنند. اساس همه ی روشهای به کار رفته، بدست آوردن یک یا دو پخش برای هر توصیفگراست. و سپس با استفاده از مبناهای مختلف که اغلب تست های آماری هستند، توصیفگرهای مناسب انتخاب می شوند. از جمله ی این روش ها که برای انتخاب متغیر و همچنین رتبه دار کردن متغیرها به کار می رود می توان به: جک نایف و تست تصافی کردن بر اساس تست- t، استفاده از خطای نوع اول و نوع دوم و استفاده از عکس انحراف استاندارد نسبی تحت عنوان c-value اشاره کرد. در این مطالعه برای اولین بار از تست آماری خطای نوع اول و نوع دوم برای انتخاب متغیر به طور موفقیت آمیزی استفاده شده است. همچنین در این گزارش برای اولین بار از تست تصادفی برای انتخاب متغیر در qsar استفاده شده است. علاوه بر داده ی سلوود از داده ی anti-hiv که شامل 107 ترکیب از مشتقات 1-[2- هیدروکسی اتوکسی- متیل]-6- (تیوفنیل) تیمین((hept است، برای ارزیابی عملکرد روش های انتخاب متغیر مورد استفاده در این گزارش، استفاده شده است. علاوه بر روش های انتخاب متغیر گوناگونی که به کار گرفته شده است روش های پیش پردازش مختلف از جمله هم مقیاس کردن، متعامد سازی توصیفگرها با استفاده از gso و همچنین استفاده از spa برای حذف مشکل هم خطی بودن در میان توصیفگرها استفاده شده است. در مورد داده ی سلوود استفاده از همه ی روش های: جک نایف، تست تصادفی کردن، تست تصادفی کردن با متغیر وابسته ی رندوم، خطای نوع اول و نوع دوم و همچنین استفاده از روش حذف متغیرهای بی معنی که اطلاعاتی بیش از متغیر های نویزی ندارند با پیش پردازش gram-schmidt منجر به انتخاب یک مجموعه واحد از متغیرها می شود که عبارتند از: log p ، vdwvol ، nsdl7 ، s8-1cy ، .sum-f نکته ی جالب آنست که حتی رتبه ی متغیر های انتخاب شده نیز در اکثر این روش ها برابر است. اما با پیش پردازش هم مقیاس کردن و spa نتیجه ی تکرار پذیر با قدرت پیش بینی بالایی بدست نمی آید. در مورد داده ی anti-hiv تنها با استفاده از spa است که مدل های قابل قبول با همه ی روش های انتخاب متغیر ذکر شده بدست می آید، در روش uve و با استفاده از داده های معرفی شده با spa با 10 متغیر می توان به قدرت پیش بینی بالایی رسید یعنی 0.95q2 = . در ضمن توصیفگرهای انتخاب شده در این روش ها اگر چه از نظر تعداد با هم متفاوتند ولیکن اغلب توصیفگرهای آنها مشترک است. اینکه روش های مختلف دارای نتایج یکسانی هستند کاملا به روش پیش پردازش آنها ربط دارد. و این gso در داده ی سلوود و همچنین spa در داده ی anti-hiv است که سبب بهبود و یکسان شدن عملکرد روش های مختلف شده است. نوع روش پیش پردازش مناسب به طور کلی به ماهیت داده ربط دارد. و استفاده از پیش پردازش ها یا روش انتخاب متغیر اولیه تاثیر زیادی بر نتیجه ی نهایی مدل دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

انتخاب و رتبه بندی طرح های اشتغالزا با استفاده از روشهای تاپسیس و الکتر

گرچه دانش آموختگان حدود 10 درصد جامعه بیکاران را تشکیل می دهند اما امید به ایجاد اشتغال برای دیگر اقشار از طریق دانش آموختگان بسیار زیاد است. در شرایطی که فرصت و منابع مالی کشور برای حمایت از اشتغال و کارآفرینی محدود است سرمایه گذاری به منظور فراهم کردن زمینه اشتغال این افراد به دلیل آمادگی بالای علمی و توان کارآفرینی آنان و نیز امکانات ایجاد اشتغال برای دیگر افراد جامعه از این طریق، در اولویت ...

متن کامل

The Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad

کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...

متن کامل

The effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2

كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...

متن کامل

انتخاب و رتبه بندی طرح های اشتغالزا با استفاده از روشهای تاپسیس و الکتر

گرچه دانش آموختگان حدود 10 درصد جامعه بیکاران را تشکیل می دهند اما امید به ایجاد اشتغال برای دیگر اقشار از طریق دانش آموختگان بسیار زیاد است. در شرایطی که فرصت و منابع مالی کشور برای حمایت از اشتغال و کارآفرینی محدود است سرمایه گذاری به منظور فراهم کردن زمینه اشتغال این افراد به دلیل آمادگی بالای علمی و توان کارآفرینی آنان و نیز امکانات ایجاد اشتغال برای دیگر افراد جامعه از این طریق، در اولویت ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده شیمی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023