الهام باهر

نام پژوهشگر: الهام باهر

پیش بینی و مطالعهqspr بازداری ترکیبات آلی، دارویی و آلاینده ها با استفاده از رگرسیون بردارهای پشتیبان

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه مازندران 1388
الهام باهر محمد حسین فاطمی

چکیده پژوهش حاضر در شش قسمت به منظور بررسی رابطه qspr/qsar ترکیبات مختلف با استفاده از روش های متفاوت مدلسازی خطی و غیرخطی انجام گردید. همچنین اثر روش های گوناگون انتخاب متغیر بر مدل های ایجاد شده، مورد بررسی قرار گرفت. در بخش اول، هدف، ارائه یک مدل qsar جهت پیش بینی فاکتور بزرگنمایی زیستی برخی از آلاینده های ارگانوکلره است. بدین منظور پس از محاسبه توصیف کننده های مولکولی از روش های رگرسیون خطی چندتایی (mlr) و الگوریتم ژنتیکی (ga) برای انتخاب توصیف کننده های موثر در فاکتور بزرگنمایی زیستی استفاده شد. سپس توصیف کننده های انتخابی به عنوان ورودی برای مدل های mlr و شبکه عصبی مصنوعی (ann) بکار گرفته شدند که در نتیجه مدل ga-ann با انحراف استاندارد 03/0 و 20/0 برای سری آموزشی و آزمون، انتخاب شد و در نهایت از روش آنالیز حساسیت برای تعیین اهمیت نسبی توصیف کننده ها در ann استفاده گردید. در بخش دوم، پیش بینی فاکتور بازداری برخی از مشتقات بنزن و هتروسیکل ها در کروماتوگرافی مایسلی الکتروسینتیک (mekc) با استفاده از مدل ann انجام شد، بدین منظور توصیف کننده های موثر با استفاده از روش mlr مرحله ای انتخاب شدند و پارامترهای آماری q2 و spress پس از آزمون ارزیابی تقاطعی برای مدل های mlr و ann بدست آمدند که مقایسه این نتایج، برتری مدل ann را با 57/0=q2 و 55/0=spress نشان داد. در بخش سوم، ثابت سرعت تخریب آلکنها با رادیکال oh به عنوان معیاری از طول عمر تروپسفری آنها با استفاده از روش های mlr، ann و ماشین بردار پشتیبان (svm) مورد مدل سازی قرار گرفت. همچنین انتخاب متغیر با دو روش mlr و ga انجام شد و نتایج حاصل از مدل سازی آنها مقایسه گردید که نتایج برتری مدل ga-ann را نشان می دهد. همچنین به منظور بررسی اهمیت توصیف کننده ها در ann روش توزیع نسبی مورد استفاده قرار گرفت. در بخش چهارم، مطالعه qspr پتانسیل نیمه موج اکسایش بنزواکسازین ها با روش svm انجام شد پس از انتخاب توصیف کننده های موثر به روش هیورستیک (hm) و تقسیم سری داده به دو گروه آموزشی و آزمون، چگونگی توزیع مولکول ها در فضای ساختاری آنها توسط روش آنالیز پراکندگی مورد بررسی قرار گرفت. به منظور ارزیابی بیشتر مدل از روش ارزیابی تقاطعی استفاده گردید که مقادیر920/0=q2 و 020/0=spress برای مدل mlr و 949/0=q2 و 015/0=spress برای مدل svm بدست آمد. مقایسه نتایج حاصل، برتری مدل svm را نشان می دهند. در بخش پنجم، مدل سازی اندیس بازداری آلکیل فنول ها انجام شد. بدین منظور پس از محاسبه و انتخاب توصیف کننده ها و بررسی آنالیز پراکندگی، روش های svm و mlr برای ایجاد مدل بکار رفتند. همچنین روش ارزیابی تقاطعی برای ارزیابی بیشتر مدل مورد استفاده قرار گرفت که مقادیر896/0=q2 و 680/0=spress برای مدل mlr و 893/0=q2 و 670/0=spress برای مدل svm بدست آمد. مقایسه پارامترهای آماری، برتری مدل svm را نشان داد. در بخش ششم نیز به منظور پیش بینی حلالیت آبی برخی از داروها، از ماشین بردار پشتیبان استفاده شد. برای انتخاب توصیف کننده های موثر از روش ga و mlr مرحله ای استفاده گردید و آنالیز پراکندگی داده ها بر روی آنها انجام شد. پس از انجام ارزیابی تقاطعی و مقایسه نتایج مدل svm و mlr و کارهای انجام شده قبلی، برتری مدل ga-svm به اثبات رسید. واژه های کلیدی شبکه عصبی مصنوعی، ماشین بردار پشتیبان، الگوریتم ژنتیک، رگرسیون خطی چندتایی، آنالیز حساسیت، آنالیز پراکندگی مولکول ها.