نام پژوهشگر: بهزاد ربیعی قهفرخی

رتبه بندی چندتایی قوانین استخراج شده از داده کاوی با استفاده از الگوریتم ژنتیک
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی صنعتی کرمان - دانشکده برق و کامپیوتر 1392
  بهزاد ربیعی قهفرخی   علی اکبر نیک نفس

با توجه به گسترش روز افزون داده ها در پایگاه های داده و ناتوانی مغز انسان در تجزیه و تحلیل این داده ها و به وجود آمدن چالشی جدید به نام انفجار اطلاعات در عصر حاضر، نیاز به ابزاری که بتوان با استفاده از آنها کاستی ها و نقایص بیان شده را به حداقل رساند، به شدت احساس می¬شود. امروزه در زمینه¬ی پایگاه های داده فرآیندی به وجود آمده است که آنرا داده کاوی می¬نامند. هدف از داده کاوی کشف و استخراج دانش مفید از بین انبوه داده هاست. استخراج قوانین یکی از متداول ترین روش ها برای تولید الگو از بین داده ها است. به عنوان مثال قوانین کلاس بندی و انجمنی می توانند به عنوان خروجی های یک مجموعه داده در نظر گرفته شوند. بعد از استخراج قوانین، تعدادی قانون دسته بندی "اگر...آنگاه..." وجود خواهد داشت که با یکدیگر متفاوت هستند. میزان جذابیت و ارزش این قوانین با یکدیگر برابر نیست. علاوه بر این از بین قوانین استخراج شده تنها تعدادی محدود برای پیاده سازی ها مورد استفاده قرار می گیرد که به دلیل کمبود بودجه، زمان و منابع در دسترس است. در این پژوهش با استفاده از الگوریتم ژنتیک و مجموعه داده¬ی در زمینه ی بازار بورس ایران و با استفاده از درخت تصمیمی به نام c5.0 یک روش رتبه بندی چندتایی معرفی می¬کنیم. این روش قوانین استخراج شده توسط درخت تصمیم را به صورت کدهایی در ژن های هر کروموزوم نگاشت می¬کند و قوانین برتر را با توجه به تابع برازشی به نام تعداد رکوردهای به درستی پیش بینی شده استخراج می کند. پس از استخراج قوانین برتر، نتایج را با چندین روش رتبه بندی مورد مقایسه قرار داده و روش پیشنهادی برتری مطلقی را نسبت به تمامی روش ها نشان می دهد.