نام پژوهشگر: نفیسه سلیمانی

ارائه ی یک مدل خوشه بندی تودرتو با رویکرد مدل های برنامه ریزی ریاضی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد 1387
  نفیسه سلیمانی   محمدمهدی سپهری

خوشه بندی، قرار دادن داده ها در کنار یکدیگر، بر اساس ماهیت درونی آن هاست. محققان طبقه بندی های مختلفی برای الگوریتم های خوشه بندی ارائه داده اند. یک طبقه بندی سه تایی شامل مدل های خوشه بندی افرازی مدل های خوشه بندی سلسله مراتبی و خوشه بندی فازی، از کلی ترین تقسیم بندی ها محسوب می شود. به طوری که مدل های افرازی، سلسله مراتبی و فازی اشتراکی با یکدیگر ندارند. با این حال، استفاده از الگوریتم های سلسله مراتبی به عنوان جواب اولیه برای خوشه بندی افرازی، اولین پل ارتباطی بین حوزه ی خوشه بندی افرازی و خوشه بندی سلسله مراتبی محسوب می شود.در این پژوهش یک مدل خوشه بندی تودرتو، از ترکیب حوزه ی خوشه بندی افرازی و حوزه ی سلسله مراتبی ارائه می شود. این مدل توسط ابزار بهینه سازی، می تواند داده ها را در چند سطح متداخل، پیوسته و همزمان، خوشه بندی نماید. کاربرد مدل خوشه بندی تودرتو، در تعیین خوشه های شبیه به هم و تشخیص میزان نزدیکی آن ها به یکدیگر است و می توان آن را دومین پل ارتباطی بین حوزه ی خوشه بندی افرازی و سلسله مراتبی دانست. مدل خوشه بندی تودرتو، بر مبنای خوشه بندی افرازی ساخته شده است. به همین دلیل سعی بر آن شد از تابع هدفی استفاده شود که داده ها را با درصد خلوص بالاتری خوشه بندی نماید. تابع هدف مورد استفاده در این ساختار، با رویکرد خارج از خوشه و حداکثر کردن مجموع فواصل بین خوشه ها شکل گرفت که این تابع هدف برای اولین بار در این پژوهش ارائه می شود. مدل خوشه بندی تودرتوی ارائه شده را k-nclus نامیده ایم و دارای دو ویژگی اساسی است. اول آن که سطوح پایین خوشه بندی در سطوح بالا تر شکسته نمی شود و دوم آن که کلیه ی سطوح خوشه بندی به صورت همزمان خوشه بندی می شود. مدل k-nclus بر اساس اصل استقرا، راه حلی برای حالت های اولیه ی یک سطحی، دو سطحی، سه سطحی ارائه و سپس بر پایه ی دو اصل اساسی تا سطح k ام تعمیم داده می شود و یک ساختار کلی برای مسئله ایجاد می نماید. برای اثبات درستی مدل ارائه شده نیز چند پایگاه داده ی مجازی مورد استفاده قرار می گیرد. کلیه ی سطوح مدل خوشه بندی تودرتو دارای عملکرد یکسانی است که با ماهیت سلسله مراتبی به یکدیگر مربوط شده اند. مدل تک سطحی خوشه بندی تودرتو، یک مدل خوشه بندی افرازی است که با رویکرد جداسازی خوشه ها از یکدیگر و با تابع هدف حداکثر کردن مجموع فواصل بین خوشه ها ساخته می شود و سطوح بالا تر خوشه بندی تودرتو، روی آن مدل تک سطحی قرار می گیرد. علاوه بر آن، یک مدل خوشه بندی افرازی دیگری با رویکرد فشردگی درون خوشه و تابع هدف حداقل کردن مجموع فواصل درون خوشه ارائه می شود. به ترتیب، مدل اول را مدل bgsd و مدل دوم را مدل wgsd نامیده ایم. به منظور اعتبار سنجی درونی و بیرونی مدل های ارائه شده از سه پایگاه داده ی واقعی و سه مجموعه داده ی مجازی استفاده شده است. برای مقایسه ی مدل های پیشنهادی با مدل های ارائه شده در منابع تحقیق نیز معیار مجموع مربعات درون خوشه در نظر گرفته شده است. نتایج بدست آمده نشان می دهد مدل bgsd داده ها را با خلوص بیشتر و مجموع مربعات فاصله ی کمتری خوشه بندی می کند.