ارائه رهیافتی جدید از کاربرد الگوریتم های فرامکاشفه ای در مسأله انتخاب ویژگی برای مجموعه داده های بزرگ

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی
  • نویسنده محسن شفیعی
  • استاد راهنما رضا منصفی داود کریم زادگان
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1391
چکیده

دسترس پذیری بالای داده ها در جوامع اطلاعاتی کنونی، وجود ابزاری معتبر و کارآمد به منظور مدل سازی و تحلیل داراییهای با ارزش (اطلاعات) را ملموس تر می نماید. از موانع مهم در استفاده ابزارهای داده کاوی در این راستا حجم بالای داده های مورد بررسی است که هزینه های زمانی و تحلیلی زیادی را به دنبال دارد. در اغلب موارد می توان با حذف داده های زائد وبی ارزش علاوه بر کاهش هزینه های کاوش، صحت نتایج تولیدی را نیز تا حد قابل قبولی حفظ کرد. انتخاب ویژگی یکی از روش هایی است که سعی دارد با کاهش تعداد صفات داده های مورد بررسی هزینه های داده کاوی را کاهش دهد، ولی از آن جا که خود روال انتخاب ویژگی مناسب جزو مسائل np-complete است، می توان به جای تولید پاسخ قطعی با صرف زمان قابل ملاحظه، به دنبال رسیدن به پاسخ قابل قبول باشیم. استفاده از رویکرد فرامکاشفه ای برای این منظور مناسب و پرکاربرد است، در این پایان نامه با ترکیب و ایجاد تغییرات مناسب در روش های متداول فرامکاشفه ای مانند روش کلونی مورچه ها، جستجوی هارمونیک و بهینه سازی ذرات هوشمند توانسته ایم به ایجاد بهینگی در این روش ها برای حل مسأله انتخاب ویژگی دست یابیم، که نتایج حاصل از اعمال این تغییرات با شبیه سازی انجام شده با نرم افزار متلب و بر روی مجموعه داده های بزرگ و معتبری مانند گیست و درثا که به منظور استفاده در روش انتخاب ویژگی مناسب سازی شده است اعمال و نتایج حاصل تایید کننده بهینگی روش مورد بررسی است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مدلسازی رواناب ماهانه با استفاده از روشهای داده کاوی براساس الگوریتم های انتخاب ویژگی

باتوجه به اهمیت مقدار جریان خروجی از حوضه آبریز جهت مدیریت آب­های سطحی، فهم دقیق ارتباط بین مقدار رواناب با پارامترهای اقلیمی همچون بارش و دما و شناسائی موثرترین پارامتر در فرآیند مدل­سازی بسیار مهم می‌باشد. در این تحقیق پس از آزمون همگنی داده‌های بارش، دما و رواناب ماهانه حوضه آبریز ناورود، ابتدا براساس دو الگوریتم رلیف و همبستگی دو ترکیب مختلف از پارامترهای موثر در رواناب مورد توجه قرار گرفت....

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره

تشخیص داده‌های خارج از ردیف چند متغیره به کمک الگوریتم‌های داده‌کاوی یکی از نکات ضروری پیش‌پردازش داده‌های اکتشافات ژئوشیمیایی محسوب می‌شود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روش‌های آماری، روش‌های مبتنی بر مجاورت، روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر دسته‌بندی هستند، معرفی شده و کاربرد آنها بر روی دا...

متن کامل

ارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده

اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری  شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز ت...

متن کامل

ارائه یک مدل جدید ریاضی برای مسأله مسیریابی سرویس مدارس و حل آن توسط الگوریتم پیشنهادی

مقاله حاضر در خصوص ارائه و حل یک مدل مسیریابی سرویس مدارس است. مسیریابی سرویس مدارس حالت خاصی از مدل مسیریابی است. در مدل ارائه‌شده، بر خلاف بسیاری از مدل‌های ریاضی مطرح‌شده در این زمینه، مکان‌یابی و مسیریابی ایستگاه‌ها، همزمان در نظر گرفته می‌شوند و خودروهای آن غیرهمگن هستند. از سوی دیگر به جای مکان‌یابی مدارس که در نقش مراکز توزیع عمل می‌کنند، ما سعی در مکان‌یابی ایستگاه-های اتوبوس داریم که د...

متن کامل

استراتژی‌های جدید حافظ تنوع برای الگوریتم ژنتیک و کاربرد آن برای بهینه‌سازی مقیاس بزرگ

جهت افزایش کارایی الگوریتم ژنتیک، رویکردهای فراوانی باهدف حفظ تنوع منتشر شده است. باوجود این، اکثر این رویکردها فقط می‌توانند روی مسائل بهینه‌سازی پیوسته اعمال شوند. این بدان معنا نیست که الگوریتم‌های ژنتیک در حل مسائل بهینه‌سازی گسسته به تنوع جمعیت نیاز ندارند. در حقیقت، تعریف مفهوم تفاوت بین جواب‌های راه‌حل‌های مسائل بهینه‌سازی گسسته، با توجه به تفاوت ظاهری آن‌ها ساده نیست. برای مثال در مسئله...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023