نام پژوهشگر: محمدتقی رضوان

توسعه مدل های دسته بندی و استخراج قواعد بر مبنای نوع داده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده مهندسی صنایع 1393
  محمدتقی رضوان   علی زینل همدانی

دسته بندی یکی از اهداف مهم داده کاوی و بازیابی دانش بوده که به تخصیص یک نمونه به دو یا چند دسته یا گروه از پیش تعیین شده گفته می شود. دسته بندی در زمینه های مختلف مطالعاتی از جمله مباحث مالی، بیولوژی، پزشکی و غیره کاربرد دارد. افزایش عملکرد و قابلیت مدل های دسته بندی همیشه مورد توجه بوده است. انتخاب مشخصه یک روال پیش پردازش در داده کاوی و شناخت الگو است. این رساله با استفاده از نظریه مجموعه سخت و تابع درجه وابستگی، الگوریتمی کارا برای انتخاب مشخصه معرفی نموده و با گسترش یک درخت از زیرمجموعه های مشخصه های اصلی و جستجوی حداقلی با هرس کردن برخی از شاخه ها براساس خاصیت یکنوایی و همچنین شروع جستجو از یک جواب حریصانه، الگوریتمی کارا و دقیق برای مجموعه داده های رسته ای ارائه می نماید. همچنین مدل های دسته بندی با عملکرد مناسب توسعه داده می شود که توانایی مواجه با انواع مشخصه ها شامل عددی، رسته ای و مخلوط را داشته و بتواند بدون تغییر شکل آنها، رفتار متمایزی با هر نوع داده داشته باشد. در واقع، معیارهای فاصله یا مشابهت مدل استنتاج مبتنی بر نمونه ساخته می شود. این معیارهای فاصله، ضمن لحاظ کردن وزن هر مشخصه، از فاصله اقلیدسی برای مشخصه های عددی و از وقوع همزمان مقادیر مختلف برای مشخصه های رسته ای استفاده می کند. محاسبه مقادیر مختلف مشخصه های رسته ای در دو وضعیت با توجه و بدون توجه به دسته محاسبه می شود. علاوه بر این، الگوریتم ژنتیکی پیشنهاد می شود که همانند مدل های استنتاج مبتنی بر نمونه نیاز به عملیات پیش پردازش نداشته و ضمن داشتن عملکرد قابل قبول می تواند قواعد دسته بندی را استخراج نماید. نتایج بدست آمده،حاصل اجرای الگوریتم ها و مدل های دسته بندی پیشنهادی بر روی مجموعه داده های شناخته شده و مقایسه آنها با نتایج ابزارهای تحقیقات پیشین می باشد. مسئله عیب چسبندگی بر روی کلاف های نورد سرد شرکت فولاد مبارکه به عنوان یک مسئله دسته بندی در نظر گرفته شد و پارامترهایی که در ایجاد این عیب، موثر بودند شناسایی شده و بر اساس وجود یا عدم وجود اطلاعات انتخاب گردیدند. پس از پالایش مجموعه داده، عملکرد مدل های دسته بندی پیشنهادی رساله و برخی از ابزارهای شناخته شده روی این مجموعه داده، مورد آزمون قرار گرفته و مشخصه های با اهمیت در دسته بندی ورق ها شناسایی و قواعد دسته بندی با بالاترین دقت جهت تنظیم پارامترهای مختلف فرآیندی به منظور کاهش و حتی حذف عیب استخراج گردیده اند.