نام پژوهشگر: فاطمه شمس عزت

ترکیب یادگیرنده ی چند برچسبی iblr-ml با تکنیک های کیسه ای و ترفیعی، جهت بهبود روی داده های نامتوازن
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده ریاضی و کامپیوتر 1390
  فاطمه شمس عزت   اشکان سامی

قه بندی چند برچسبی گسترش یافته روش های طبقه بندی سنتی است. که در آن هر نمونه می تواند به مجموعه ای از برچسب ها متعلق باشد. مثال هایی از داده های چند برچسبی در کاربرد های واقعی بسیار زیاد است که خود بیانگر اهمیت آن می باشد. به عنوان مثال یک فیلم می تواند به طور هم زمان هم به عنوان جنگی، هم جنایی و هم هیجان انگیز برچسب بخورد. از سوی دیگر مشاهده می شود که اکثر مجموعه های داده ای، در دنیای واقعی به صورت نامتوازن هستند. از این رو به بهبود روش طبقه بندی چند برچسبی، روی مجموعه داده های نامتوازن پرداخته خواهد شد. الگوریتم iblr_ml از ترکیب دو الگوریتم نزدیک ترین همسایه و رگرسیون منطقی ایجاد شده است. در این پایان نامه برای افزایش قدرت تحمل این الگوریتم، در مقابل داده های نامتوازن، این روش با الگوریتم های تجمعی کیسه ای و ترفیعی ترکیب گردیده. در نهایت برای ارزیابی روش پیشنهادی، بامجموعه داده های متفاوتی اجرا گردیده که نتایج بیانگرکارایی خوب روش پیشنهادی است. ایده دیگری که در این پایان نامه به آن پرداخته شده، ارائه اولین روش برای چند برچسبی کردن مجموعه داده تک برچسبی و به کار گیری آن برای مجموعه داده مرتبط با مخازن نفت می باشد. سپس بااستفاده از مجموعه داده چند برچسبی حاصله والگوریتم پیشنهادی،یک یادگیرنده جهت پیشنهاد بهترین روش ازدیاد برداشت از مخازن نفت جدید ایجادشده است. همچنین تلاش شد که برای بهبود کارایی الگوریتم iblr-ml، بخش دوم آن با الگوریتم ivm جایگزین گردد. نتایج حاصل از ارزیابی نشان می دهد که این الگوریتم نسبت به تمام الگوریتم هایی که در رده پایین تری از iblr-ml قرار گرفته اند کارایی بهتری دارد.