نام پژوهشگر: سید‌حمید حاج‌سید‌جوادی

بهبود داده کاوی نزدیکترین زیررشته به وسیله سیستم کلونی مورچگان
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده کامپیوتر و فناوری اطلاعات 1390
  فرانک بهره دار   سید حمید حاج سید جوادی

در دنیای به شدت رقابتی امروز، اطلاعات به عنوان یکی از فاکتورهای تولیدی مهم محسوب می شود. با توجه به رشد روز افزون اطلاعات و دانش، حجم های بسیار بالا از این اطلاعات و دانش موجود می باشد که جستجو برای یافتن اطلاعاتی خاص در آنها به راحتی امکان پذیر نمی باشد. لذا مجتمع شدن این حجم از داده ها در پایگاه های داده ای و انجام عملیات کشف دانش و داده کاوی برای این منابع امری ضروری است. مشابهت الگو در کاربردهای زیادی مورد مطالعه قرار گرفته است. در حوزه داده کاوی، کاوش الگوهای تکراری مسئله ای است که به دنبال پیدا کردن الگوهایی است که بیش تر از حد آستانه در پایگاه داده ظاهر می شوند. مسئله نزدیکترین زیر رشته از دسته مسائل تئوری علوم کامپیوتر است و در کاربردهای مهمی مورد استفاده قرار می گیرند. این مسئله در سالیان گذشته به طور گسترده در ریاضیات زیستی مورد مطالعه قرار گرفته است. این مسئله از میان مجموعه رشته های ورودی به دنبال زیر رشته ای است که کمترین فاصله همینگ (تفاوت) را با دیگر رشته ها داشته باشد. این تحقیق به ارائه و ارزیابی یک راه حل مبتنی بر الگوریتم فرا اکتشافی بهینه سازی اجتماع مورچگان برای حل مسأله نزدیکترین زیر رشته می پردازد. در روش پیشنهادی علاوه بر بهینه سازی زمان اجرا، میانگین فاصله همینگ نیز بهینه شده است. نتایج بدست آمده در مقایسه با آخرین نمونه های مشابه که از الگوریتم های جستجوی تصادفی هستند صحت کارایی بالاتر الگوریتم را تایید می کند.