نام پژوهشگر: محمد حسین یغمائی

شناسایی تذکرات جعلی با روش شباهت بین تذکرات
پایان نامه دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد شاهرود - دانشکده مهندسی برق و کامپیوتر 1393
  سمانه عمودی   امیدرضا معروضی

با توجه به هدف اصلی اشتراک داده‏ها ، وب نقش مهمی در مسائل فرهنگی - آموزش وتجاری دارد . وبلاگ به عنوان یک نوع شبکه اجتماعی، به طور گسترده در سال‏های اخیر استفاده شده است. نظرات ، بخش اصلی وبلاگ و شاخص خوبی برای نمایش اهمیت آن هستند و با توجه به محبوبیت وبلاگ نویسی اسپم وبلاگ، به یکی از منابع رایج اسپم تبدیل شده است. با توجه به مطالعات اندکی که در حوزه اسپم شناسی در وبلاگ های فارسی وجود دارد، در این پژوهش ما بر آن شدیم ضمن مرور کوتاه بر تحقیقات انجام شده در زمینه شناسایی اسپم به طراحی سیستمی جهت شناسایی اسپم نظرات در وبلاگ های فارسی با استفاده از معیار تشابه جاکارد بین نظرات و پست – نظرات به عنوان ویژگی های محتوایی به همراه معیارهایی چون طول نظرات ، تعداد لینک ها، تعداد ایست واژه ها به عنوان ویژگی های غیرمحتوایی در نظرات ارسالی کاربران و ارزیابی آن با چند مدل داده کاوی از جمله درخت تصمیم، naïve bayes و شبکه های عصبی بپردازیم