نام پژوهشگر: زهره‌السادات ناظمی

حل مسائل خوشه بندی با استفاده از بهینه سازی شبیه سازی حرارتی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده علوم 1388
  زهره السادات ناظمی   کورش زیارتی

خوشه بندی فرایندی است که در طی آن مجموعه ای از نمونه ها به خوشه هایی تقسیم می شوند که اعضای هرخوشه بیشترین شباهت را به یکدیگر داشته باشند و خوشه های مختلف با یکدیگر بیشترین تفاوت را داشته باشند. خوشه بندی یکی از تکنیک های داده کاوی و آنالیز داده متعارف می باشد. درخوشه بندی داده ها، در مسائل با اندازه داده بزگتر رسیدن به حل بهینه مشکل تر می باشد و در نتیجه مدت زمان لازم برای رسیدت به حل های قابل قبول طولانی تر می شود. یکی از مهمترین تکنیک های خوشه بندی، خوشه بندی بر مبنای k-means می باشد. در این خوشه بندی نمونه ها به k خوشه تقسیم می شوند. اگر چه الگوریتم k-means راحت و در بسیاری از مسائل سریع می باشد، اما دو مشکل اساسی دارد، یکی حساسیت به فرض اولیه و دیگری قرارگرفتن در می نیمم محلی می باشد. اگر چه با استفاده از الگوریتم های k-harmonic means و fuzzy k-means می توان مشکل حساسیت به فرض اولیه را برطرف کرد، اما همچنان مشکل قرار گرفتن در می نیمم محلی وجود دارد. دراین تحقیق ما روشی را برای حل مشکل قرار گرفتن در می نیمم محلی بر مبنای تکنین شبیه سازی حرارتی ارائه داده ایم. k-means (km) و k-harmonic means (khm) و fuzzy k-means (fkm) سه الگوریتمی می باشند که در این تحقیق برای تاثیر اثر الگوریتم شبیه سازی حرارتی بر روی خوشه بندی مورد استفاده قرار گرفته اند. این الگوریتم ها همگی از نوع الگوریتم های خوشه بندی بر مبنای مرکز می باشند. شبیه سازی حرارتی همانطور که از نامش پیداست، روشی بر مبنای گرم شدن و دوباره سرد شدن فلزات و رسیدن به می نیمم انرژی ساختار کریستالی می باشد و به همین خاطر در بیشتر سیستم ها برای یافتن می نیمم مطلق استفاده می شود. این الگوریتم اولین بار بوسیله متروپولیس برای یافتن آرایش تعادلی مجموعه ای از اتم ها در یک دمای خاص پیشنهاد شد. این الگوریتم از نوع الگوریتم های فرا ابتکاری می باشد. مزیت اصلی الگوریتم شبیه سازی حرارتی نسبت به بقیه روش های فرا ابتکاری همچون الگوریتم های جستجوی ممنوع، ژنتیک، شبکه های عصبی، بهینه سازی مورچه ای، توانایی آن در رهایی از می نیمم محلی می باشد. مساله ای که در حل مشکل الگوریتم های خوشه بندی می تواند موثر باشد. دراین تحقیق ما الگوریتم شبیه سازی حرارتی را بر روی سه نوع الگوریتم خوشه بندی پیاده کرده ایم و الگوریتم های جدید sakm و sakhm و safkm راپیشنهاد داده ایم. ما الگوریتم پیشنهادی را بر روی چندین دسته از داده های متعارف و مشهور مانند iris و wine و breast cancer اجرا کرده ایم و مشاهده کرده ایم که با استفاده از الگوریتم شبیه سازی حرارتی توانسته ایم مشکلات موجود در الگوریتم های خوشه بندی همچون مساله حساسیت به فرض اولیه و قرار گرفتن در می نیمم محلی را به خوبی برطرف کنیم و بتوانیم به می نیمم مطلق در مقدار تابع هدف دست یابیم.