خوشه‌بندی خودکار داده‌های مختلط با استفاده از الگوریتم ژنتیک

نویسندگان

  • Vard, Mahdi MSc, School of Railway Engineering - Iran University of Science and Technology
  • Yaghini, Masoud Assistance professor of School of Railway Engineering - Iran University of Science and Technology
چکیده مقاله:

In the real world clustering problems, it is often encountered to perform cluster analysis on data sets with mixed numeric and categorical values. However, most existing clustering algorithms are only efficient for the numeric data rather than the mixed data set. In addition, traditional methods, for example, the K-means algorithm, usually ask the user to provide the number of clusters. In this paper, we propose a new method to cluster mixed data and automatically evolve the number of clusters as well as clustering of data set. In the proposed method, Davies-Bouldin Index is used as fitness function and we use the genetic algorithm to optimize fitness function. Also, we use a more accurate distance measure for calculating the distance between categorical values. The performance of this algorithm has been studied on real world and simulated data sets. Comparisons with other clustering algorithms illustrate the effectiveness of this approach.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

خوشه بندی خودکار داده های مختلط با استفاده از الگوریتم ژنتیک

مساله خوشه بندی به منظور کمینه کردن مجموع مجذور انحراف، یک مساله غیر خطی و غیر محدب بوده و دارای تعداد زیادی نقاط بهینه محلی است. در مسائل خوشه­بندی در دنیای واقعی، اغلب با مجموعه داده­هایی مواجهیم که از ترکیبی از مقادیر عددی و دسته­ای تشکیل شده­اند. در حالیکه اغلب روشهای خوشه­بندی موجود تنها بر روی داده­های عددی از کارایی مناسبی برخوردارند و قابلیت استفاده بر روی داده­های مختلط را ندارند. از س...

متن کامل

واسنجی خودکار دو مدل بارش‌- رواناب تانک و SIMHYD با استفاده از الگوریتم ژنتیک

شبیه‌‏سازی روابط بارش- رواناب کانون اصلی توجه تحقیقات هیدرولوژی در دهه‌‏های گذشته بوده و مدل‏‏های زیادی برای این منظور پیشنهاد شده است. انتخاب مدل به هدف از مدل‌سازی و اطلاعات در دسترس بستگی دارد. در این مطالعه، عملکرد نسبی دو مدل یکپارچه و مفهومی تانک[1] و SIMHYD  مقایسه شد. در هر دو مدل ذکرشده محدودة تغییرات پارامترها زیاد است؛ در نتیجه، استفاده از روش سعی و خطا برای بهینه‌سازی پارامترها مشکل...

متن کامل

برآورد خودکار مشخصات حوضه با استفاده از خصوصیات هیدروگراف مشاهده‌ای، HEC-HMS، الگوریتم ژنتیک و AutoIt

مهمترین هدف در واسنجی مدل‌های مفهومی بارندگی-رواناب (CRR) پیدا کردن مقادیر بهینه برای مدل می‌باشد که با استفاده از آن بتوان بهترین منحنی را برای هیدروگراف‌های مشاهده‌ شده و محاسبه‌ شده برازش داد.  با وجود عمومیت این مدل‌ها، در صورتی که نتوان یک مقدار بهینه منحصر به فرد برای پارامترهای آن با استفاده از واسنجی خودکار به دست آورد، کاربرد آن مدل‌ها بسیار مشکل خواهد بود. همچنین استفاده از هیدروگراف‌...

متن کامل

طراحی جدول زمانبندی خودکار برای دروس دانشگاهی با استفاده از الگوریتم های ژنتیک

طراحی جدول زمان­بندی، اساساً از وظایف پیچیده و وقت گیر برای پرسنل مسئول می­باشد که از طرفی انجام خودکار آن گامی در جهت کاهش بار کاری پرسنل و از سوی دیگر یک نمونه مطلوب برای امتحان روش­های برنامه­ریزی و ارضای محدودیت­ها در هوش مصنوعی است.  در این پژوهش، ابتدا  الگوریتم­های ژنتیک مطالعه و بررسی شده، سپس در مسأله بهینه سازی جدول زمانی دروس برای یک دانشکده فرضی مورد استفاده قرار گرفته است. د...

متن کامل

واسنجی خودکار دو مدل بارش - رواناب تانک و simhyd با استفاده از الگوریتم ژنتیک

شبیه ‏سازی روابط بارش- رواناب کانون اصلی توجه تحقیقات هیدرولوژی در دهه ‏های گذشته بوده و مدل‏‏های زیادی برای این منظور پیشنهاد شده است. انتخاب مدل به هدف از مدل سازی و اطلاعات در دسترس بستگی دارد. در این مطالعه، عملکرد نسبی دو مدل یکپارچه و مفهومی تانک[1] و simhyd  مقایسه شد. در هر دو مدل ذکرشده محدودة تغییرات پارامترها زیاد است؛ در نتیجه، استفاده از روش سعی و خطا برای بهینه سازی پارامترها مشکل...

متن کامل

ارزیابی عملکرد مدل‌های AWBM، Sacramento و SimHyd در شبیه‌سازی رواناب حوضه امامه با استفاده از بهینه‌ساز واسنجی خودکار الگوریتم ژنتیک

یکی از روش­های معتبر در شبیه­سازی فرآیند پیچیده و غیرخطی بارش–رواناب استفاده از مدل­های هیدرولوژیکی است. هدف مقاله حاضر بررسی کارایی سه مدل بارش-رواناب­ یکپارچه و مفهومی AWBM، Sacramento و SimHyd در شبیه­سازی رواناب روزانه در خروجی حوضه آبریز معرف امامه با کاربرد بهینه­ساز واسنجی خودکار الگوریتم ژنتیک است. مشابه سایر مدل­های هیدرولوژیکی، در هر سه مدل مذکور محدوده تغییر پارامترها زیاد است و با ت...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 23  شماره 2

صفحات  187- 197

تاریخ انتشار 2012-08

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023