نام پژوهشگر: مرتضی پولادخای

بهینه سازی شناسایی هرز صفحات وبی از طریق بهینه ساز pso
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه امام رضا علیه السلام - دانشکده برق و کامپیوتر 1392
  مرتضی پولادخای   مجید وفایی جهان

هرزصفحات وبییکی از چالش های اساسی دنیای موتورهای جستجو می باشد که از ابتدای پیدایش موتورهای جستجو با آن همراه بوده است. مستقل از نیت ایجاد این قبیل صفحات هدف از آن ها تغییر رتبه یک صفحه در نتایج جستجو است به نحوی که به نسبت شرایط عادی در رتبه بالاتری قرار گرفته و ترجیحاً در میان سایت های برتر نتایج جستجو برای جستارهای مختلف قرار می گیرند. با توجه به اینکه عملکرد سیستم های بهینه ساز جستجو و سیستم های ایجاد هرزصفحه وبی بسیار مشابه است و از اصول مشترکی بهره می برند در نتیجه تشخیص هرزصفحات بسیار کار دشواری بوده و تاکنون هیچ روش مطمئنی برای این موضوع ارایه نشده است. به هر حال معمولاً تکنیک های هرز صفحات وبی برای مغشوش کردن موتور جستجو پیاده سازی خواهند شد، بنابراین مطالعه اینکه چگونه به صورت خودکار بر اساس روش های یادگیری ماشین، هرز صفحات وبی را آشکار کنیم مفید است. در اغلب الگوریتم های آشکار سازی هرز صفحات، تشخیص بر اساس ماشین های یادگیری است، یعنی شناسایی هرز صفحات به عنوان یک مسئله طبقه بندی باینری مورد بحث قرار گرفته می شود، به طوریکه هرز صفحات، هرز نامه یا نرمال بر چسب می¬خوردند. در این پایان نامه در مورد چگونگی آشکار شدن هرزصفحات وبی توسط الگوریتم بهینه ساز مجموع ذرات بحث می¬کنیم. در الگوریتم بهینه ساز مجموع ذرات راه¬حل برای یک مشکل (یعنی یک تابع تشخیص) به عنوان یک ذره در یک جمعیت ارائه شده است. آزمایشات روی دیتاست2011 برای پیدا کردن پارامترهای برتر و محاسبه اعتبار بهینه ساز مجموع ذرات، انجام شده است. نتایج آزمایشات نشان می دهد الگوریتم پیشنهادی نسبت به کارهای گذشته مخصوصا الگوریتم ژنتیک دارای دقت بیشتر بوده و در زمان کمتر به نتیجه خواهد رسید. همچنین این روش در مقایسه با روش های دیگر، مانند روش بهینه سازی هرزصفحات وبی با استفاده از الگوریتم ژنتیک به پارامترهای کمی برای تنظیم احتیاج دارد.