نام پژوهشگر: عباس پیرمحمدی

طبقه بندی داده های نامتوازن با استفاده از ترکیب طبقه بندها و توصیف گرهای بردار پشتیبان
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی 1393
  عباس پیرمحمدی   علی امیری

مسئله طبقه بندی داده های نامتوازن به عنوان یکی از چالش های اصلی در حوزه ی داده کاوی، مورد توجه بسیاری از محققان و پژوهش گران قرار گرفته است. در سال های اخیر تحقیقات ارزشمند زیادی برای حل مسئله طبقه بندی داده های نامتوازن انجام شده است. در بین این تحقیقات، رهیافت های مبتنی بر ترکیب طبقه بندها از موفقیّت قابل توجهی برخوردار بوده اند. علیرغم کارهای بسیار مؤثر انجام شده در ترکیب طبقه بندها هنوز برخی چالش ها از قبیل؛ عدم توجه به اهمیت نمونه ها در متوازن سازی، تعیین تعداد مناسب طبقه بندها و عدم بهینه سازی وزن طبقه بندها در ترکیب طبقه بندها به صورت حل نشده باقی مانده است. بنابراین در این پایان نامه تلاش شده است رهیافتی برای چالش های مطرح شده ارائه شود. در این راستا، ترکیبی از الگوریتم ها جهت ایجاد ساختار پیشنهادی ارائه شده است. سیستم پیشنهادی شامل 3 بخش کلی است: در بخش اول توصیف گر بردار پشتیبان داده جهت نمونه برداری از دو کلاس اقلیت و اکثریت استفاده شده است. این روش برخلاف روش های بیش نمونه برداری و زیر نمونه برداری از داده هایی که توصیف بهتری از کل داده ها دارد، نمونه برداری می کند. در بخش دوم تعداد بهینه طبقه بندهای پایه در ترکیب طبقه بندها برای نمونه های منتخب تعیین می شود و در بخش پایانی با استفاده از الگوریتم ژنتیک عمل بهینه سازی وزن ها در ترکیب طبقه بند انجام می شود. روش پیشنهادی با تعدادی از الگوریتم های موجود در این حوزه مقایسه شده و نتایج نشان دهنده مطلوبیت ساختار پیشنهادی در مقایسه با برخی از الگوریتم ها از لحاظ دقت است.