نام پژوهشگر: محبوبه قاسم پور

طبقه بند فیشر چگالی گرا
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده فنی 1393
  محبوبه قاسم پور   هادی صدوقی یزدی

مشکلات موجود در طبقه بند جداساز خطی (lda) از قبیل حساسیت به داده های پرت، فرض اولیه تک مدی بودن توزیع کلاس ها و معکوس ناپذیری ماتریس پراکندگی داخل کلاس انگیزه ای برای ارائه طبقه بندی جدید در این طرح شد. البته در تحقیقات گذشته راهکارهایی همچون استفاده از گراف همسایگی، استفاده از نرم یک و وزنی نمودن طبقه بند برای کاهش حساسیت به داده های پرت، روش هایی مانند کاهش ابعاد، بکارگیری پارامتر تنظیم ساز و تغییر در تابع هزینه lda جهت حل مشکل معکوس ناپذیری و راه حل استفاده از ناحیه همسایگی برای مشکل تک مدی بودن ارائه شده اند. در تمام موارد فوق وجود چگالی داده ها در ساختار طبقه بند جداساز خطی از نظر دور مانده است. در این طرح برآنیم با افزودن چگالی داده ها به طبقه بند lda آن را در مقابل مشکلات تاثیر داده های پرت و معکوس ناپذیری مقاوم کنیم. علاوه بر آن، توانایی طبقه بندی مجموعه داده های غیرخطی و چند مدی را داشته باشد. همچنین با به کارگیری تکنیک ترکیب طبقه بندها مانند آدابوست، طبقه بند پیشنهادی را برای طبقه بندی مجموعه داده های حجیم توانمند ساختیم. جهت انجام آزمایش از مجموعه داده های مصنوعی، کوچک، متوسط و بزرگ از جمله مجموعه داده nslkdd که در تشخیص نفوذ کاربرد دارد، بهره بردیم. نتایج نشان می دهد طبقه بند پیشنهادی مشکلات lda را به خوبی حل می کند و مجموعه داده های غیر خطی و حجیم را طبقه بندی می نماید.