نام پژوهشگر: وحید نصرتی

ارائه روشی جهت انتخاب ویژگی در الگوریتم های تشخیص هرزنامه
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه اراک - دانشکده مهندسی 1392
  وحید نصرتی   محسن رحمانی

امروزه یکی از پرکاربردترین روش های ارتباطی استفاده از سرویس ایمیل است. به موازات این افزایش روز افزون، نرخ هرزنامه ها نیز افزایش می یابد. تاکنون دسته بندهای مختلفی برای مقابله با هرزنامه ارائه شده است. با توجه به اینکه عمل دسته بندی بر اساس یک سری ویژگی صورت می گیرد کارآیی این دسته بندها تا حدود زیادی به روش کاهش ویژگی آن وابسته است. کاهش ویژگی می تواند به دو صورت انتخاب ویژگی (بر اساس معیار خاص) و استخراج ویژگی (با ترکیب ویژگی ها) صورت گیرد. روش های موجود عمدتا از یکی از این مکانیزم ها برای کاهش ویژگی استفاده می نمایند. روش کاهش ویژگی ارائه شده در این پایان نامه از ترکیبی از این دو روش برای ساختن بردار ویژگی نهایی استفاده می کند؛ به این طریق که ابتدا فرآیند انتخاب ویژگی باعث انتخاب زیرمجموعه ای از ویژگی اولیه شده، سپس استخراج ویژگی بر روی این زیرمجموعه اعمال شده و بردار ویژگی نهایی را می سازد. در این پایان نامه در مرحله انتخاب ویژگی از روش مشهور تکرار سند و در بخش استخراج ویژگی نیز چندین روش مورد بررسی قرار می گیرند. روش های استخراج ویژگی ارائه شده در این پایان نامه دارای سه رویکرد مختلف می باشند که عبارتند از: روش های مبتنی الگوریتم ژنتیک، روش های مبتنی بر خوشه بندی و روش های مبتنی بر بیزین کمکی. در روش های مبتنی بر الگوریتم ژنتیک عملیات استخراج ویژگی توسط یک ماتریس انتقال (بهینه شده با الگوریتم ژنتیک) انجام می شود. در روش مبتنی بر خوشه بندی، ویژگی ها خوشه بندی شده و هر خوشه به یک ویژگی نگاشت می شود. در رویکرد بیزن کمکی نیز دسته بندی بر اساس دو دسته بند صورت می گیرد که یکی از آنها مبتنی بر استخراج ویژگی و دیگری بدون استخراج ویژگی می باشد. نتایج بدست آمده از پیاده سازی و تجزیه و تحلیل روش های پیشنهادی نشان دهنده افزایش بهینگی دسته بندهایی می باشد که از این ویژگی ها استفاده می نمایند.