طبقه بندی مبتنی بر جاذبه

پایان نامه
چکیده

طبقه بندی و ارتباط، شایع ترین مسائل در داده کاوی برای استخراج دانش، یادگیری ماشین، تخمین ، دسته بندی و ابزار مهمی برای برآورد و پیش بینی هستند. هدف طبقه‎بندی داده‎ها، سازماندهی و تخصیص داده‎ها به کلاس‎‎های مجزا می‎باشد. در این فرآیند بر اساس داده‎های توزیع شده، مدل اولیه‎ای آموزش داده می‎شود و سپس این مدل برای پیشگویی کلاس داده‎ی جدید مورد استفاده قرار می گیرد. در این پایان نامه مدل جدیدی برای طبقه بندی داده ها با الهام گرفتن از قانون انرژی پتانسیل گرانشی در بین ذرات به نام "طبقه بندی مبتنی بر جاذبه" ارایه شده است. مبنای اصلی در این طبقه بند یافتن مکان تعادل برای جداساز می باشد. در روش پیشنهادی داده ها به صورت ذرات دارای جرم و ثابت، که بر اساس قانون جهانی گرانش نیوتن با یکدیگر در تعامل هستند، مدل شده اند. انرژی پتانسیل، نوعی انرژی ذخیره شده است. انرژی پتانسیل، اثری سیستمی است و برای جسمی کاملاً منزوی وجود ندارد. جسم به اعتبار کمیت مکانی اش نسبت به سایر اجسامی که بر آن نیرو وارد می کنند و یا به دلیل موقعیت مکانی اش در میدانی که بر آن نیرو وارد می کنند، دارای انرژی پتانسیل است. هیچ جسم منفردی انرژی پتانسیل ندارد. همه اجسامی که برهمکنش متقابل دارند، به طور جمعی انرژی ذخیره می کنند.در مدل مطرح شده، پیکربندی پایدار وضعیتی می باشد که انرژی پتانسیل گرانشی حداقل باشد. بنابراین برای حل این مسأله بایستی انرژی پتانسیل گرانشی طبقه بند را معین و سعی در کمینه کردن آن نماییم. برای ارزیابی کارایی، ابتدا الگوریتم پیشنهادی به صورت تحلیلی مورد بررسی قرار گرفته و رسیدن به جواب بهینه سراسری برای آن اثبات شده است. سپس از دیدگاه های مختلف، ساختار و جایگاه آن مورد بررسی قرار گرفته است. در نهایت با کمک آزمایشاتی که بر روی مجموعه داده های مصنوعی، uci و هم چنین مجموعه داده های پزشکی در زمینه تشخیص سرطان انجام گرفته، کارایی الگوریتم نمایش داده شده است. این روش از قابلیت استفاده برای داده های نویزی، داده های با توزیع نامتوازن و داده هایی که اهمیت متفاوتی دارند، برخوردار می باشد. در بخش پایانی ضمن بررسی نقاط ضعف و قوت این روش، راه کارهایی برای بهبود عملکرد الگوریتم از جمله استفاده در کاربردهای برخط ارایه شده است.

منابع مشابه

بهبود کارایی طبقه بندی کننده مبتنی بر نمایش تنک برای طبقه بندی سیگنالهای مغزی

در این مقاله مسئله طبقه بندی سیگنالهای eeg مبتنی بر تصور حرکتی برای یک سیستم واسط مغز-کامپیوتر (bci)، توسط طبقه بندی کننده مبتنی بر نمایش تنک (src) مورد توجه واقع شده است. این طبقه بندی کننده برای کارایی بالا نیاز به طراحی ماتریس دیکشنری قوی دارد. با توجه به کارایی بالای الگوریتم الگوهای مکانی مشترک (csp) در سیستمهای bci، از این روش برای طراحی ماتریس دیکشنری استفاده شده است. از معایب cspحساس به...

متن کامل

طبقه بندی معنایی تصاویر متنی مبتنی بر الگوی ارزشمندی متن

استخراج اطلاعات از تصاویر متنی شناسایی شده از مجرای اینترنت یکی از مهمترین معضلات سیستم های جمع آوری اطلاعاتی در حوزه تکنولوژی اطلاعات می باشد. این مسأله وقتی حادتر می گردد که بدانیم در بین انبوه تصاویر متنی تنها درصد ناچیزی از تصاویر متنی شناسایی شده، دارای ارزش اطلاعاتی می باشند. در این مقاله، جهت تجزیه و تحلیل تصاویر متنی و دسترسی به محتوای آنها، از یک روش طبقه بندی مبتنی بر ناحیه بندی تصویر...

متن کامل

طبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری

در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...

متن کامل

طبقه بندی افراد الکلی و غیر الکلی مبتنی بر ویژگی‌های فرکانسی و غیرفرکانسی سیگنال مغزی

اثر اصلی عمده و کوتاه مدت الکل بر سیستم اعصاب مرکزی است. مصرف مشروبات الکلی باعث ایجاد ناتوانی در مغز می‌شود به‌طوری‌که مصرف زیاد مشروبات الکلی باعث فلج‌شدن فعالیت‌های مغزی، دستگاه تنفس و در نتیجه مرگ می‌گردد. در این مقاله به‌منظور تشخیص مصرف الکل، سیگنال الکتروانسفالوگرام (EEG) بیست فرد شرکت‌کننده شامل 10 فرد الکلی و 10 فرد کنترل در 64 کانال مورد بررسی قرار گرفته است. به‌منظور تحلیل سیگنال EEG...

متن کامل

یک روش تکاملی برای طبقه بندی اعتباری مبتنی بر رویکرد تجمیع زدایی ترجیحات

مدل های مبتنی بر روابط برتری یک شاخه مهم از روشهای تصمیم چندمعیاره هستند که نیاز به تعریف مقدار قابلتوجهی اطلاعات ترجیحی در قالب پارامترها توسط تصمیم گیرنده دارند. تعدد پارامترها، معنای اغلب گیی کننیدهآنها در فضای مسئله و طبیعت غیردقیق دادهها، این فرآیند را خصوصاً در مسائل طبقه بندی اعتباری با ابعیاد بیزرکه نیاز به تصمیمگیری بلادرنگ است بسیار زمانبیر و پییییده میی سیازد. بیدین منریور روی یرد ت م...

متن کامل

بهینه سازی محاسبه محدوده نواحی خطر در طبقه بندی مناطق خطرناک با رویکرد مبتنی بر ریسک

Introduction: Leakage from process equipment and the entrance of flammable fluids to surrounding atmosphere may cause flammable gas cloud. The coincidence of flammable gas cloud with ignition source could make flash fire or vapor cloud explosion that cause injury and fatality. The concept of reduction of confluence of flammable gas cloud and potential sources of ignition is known as hazardous a...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی کامپیوتر

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023