بررسی الگوریتم های knn و loop برای کشف داده های نامتعارف و امکان توسعه آن ها به حالت فازی

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان فارس - دانشکده علوم پایه
نویسنده فاطمه زارعی
استاد راهنما علیرضا فخارزاده بهمن یوسفی
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1393

چکیده

از مهم¬ترین مباحث در داده¬کاوی بحث تشخیص داده¬های ناسازگار است که روش¬های متنوعی برای تشخیص این داده¬ها پیشنهاد شده است. مهم¬ترین این روش¬ها، روش¬های مبتنی بر مجاورت (نزدیکی) هستند. که به دو دسته¬ی، روش¬های مبتنی بر فاصله و مبتنی بر تراکم تقسیم می¬شوند. برخی از کاربردهای این دو روش و روش¬های مشابه آن در مسائل دنیای واقعی برای کشف رویدادهای نادر، انحراف از اکثریت یا موارد استثنایی است؛ به عنوان مثال تشخیص فعالیت¬های جنایی در تجارت الکترونیکی، کشف اختلاس و سوء استفاده از کارت¬های اعتباری نمونه¬ای از این کاربردها است. در این پایان¬نامه یک روش از دسته روش¬های مبتنی بر فاصله و روشی دیگر مبتنی بر تراکم شرح داده شده¬اند. الگوریتم¬های این دو روش بر روی یک مجموعه داده قطعی از بیماران سرطانی پیاده سازی شده، و با مقایسه نتایج حاصل، به بیان نقاط ضعف و قوت این دو روش، و مقایسه آن¬ها پرداخته شده است. نظر به گسترش کاربرد اعداد فازی، در مباحث مرتبط با داده¬کاوی شناسایی داده¬های ناسازگار در یک مجموعه از اعداد فازی از اهمیت ویژه¬ای برخوردار است. بنابراین در این پایان نامه فعالیتی پژوهشی برای گسترش دو روش قطعی ذکر شده جهت تشخیص داده¬های ناسازگار در مجموعه¬ای عظیم از داده¬های فازی با ابعاد بالا توسط مترهای فازی هاسدورف و ورتکس صورت گرفته است. از این رو، ابتدا بر پایه¬ی این مترها به شناسایی داده¬های یک بعدی فازی با استفاده از روش¬های knn و loop پرداخته شده است. آن¬گاه پس از معرفی معیاری برای اندازه¬گیری فاصله بین دو نقطه فازی چند بعدی، دو روش تعمیم یافته مذکور برای تشخیص داده¬های ناسازگار فازی ارائه شده است و سپس این دو روش برای برخی حالت¬های مجموعه داده¬های فازی پیاده¬سازی شده است.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

روش تشخیص داده های نامتعارف با استفاده از انتگرال همبستگی موضعی و امکان تعمیم آن به مجموعه داده های فازی

عدم شناسایی داده های نامتعارف در مجموعه داده ها، در اغلب موارد باعث بروز نتایج نادرست و غیر منطقی می شود؛ لذا تشخیص درست این نوع داده ها بسیار اهمیت دارد. روش انتگرال همبستگی موضعی (loci) یکی از روش های کارآی مبتنی بر تراکم برای تشخیص داده های نامتعارف در مجموعه داده های قطعی است. در این روش داده ای نامتعارف است که تراکم آن نسبت به تراکم همسایگان خود به میزان قابل توجهی کمتر باشد. روش بر روی دا...

روشی برای رتبه بندی گزینه ها به کمک مفهوم فازی و تحلیل پوششی داده ها

متن کامل

بررسی ویژگی های اپتیکی و اندازه ذرات گرد و غبار و وابستگی های آن ها به کمک داده هایAERONET

افزایش وقوع پدیدههای گرد و غباری لزوم تحقیقات در راستای شناسایی دقیق، پایش مداوم و مقابله با این پدیده را نشان میدهد. در کنار شناسایی ویژگیهای شیمیایی، ویژگیهای اپتیکی و اندازه ذرات گرد و غبار نیز اهمیت فراوانی دارد. شناسایی گرد و غبار و ویژگیهای دقیق آن به وسیله سنجش از دور یک روش پیشرو و همچنان چالش برانگیز است که نیازمند اطلاعات از پیش تهیهای شدهای از ویژگیهای اپتیکی و اندازه ذرات گر...

متن کامل

مقایسه ی الگوریتم های مختلف طبقه بندی داده ها برای تعیین نوع زردی در نوزادان

Background and Aim: Neonatal jaundice is a matter that is very important for clinicians all over the world because this disease is one of the most common cases that requires clinical care. The aim of this study is to use data classification algorithms to predict the type of jaundice in neonates, and therefore, to prevent irreparable damages in future. Materials and Methods: This is a descripti...

متن کامل

بررسی روش فازی- آماری کشف اشتباه ها در داده های لیزر اسکنر

معمولاً خطاهای تصادفی در تمام پارامترهایی که بوسیله ی ابزارهای مشاهده گر برداشت می شوند به عنوان بخشی نامطلوب از مشاهدات وجود دارند. به منظور انجام پردازشهای تحلیلی جهت کشف این اشتباهات فرض می شود که توزیع این خطاها از تابع توزیع نرمال پیروی می کند. اشتباهات اگر حذف نشوند بر روی فرآیندهای محاسباتی بر روی مشاهدات تاثیر منفی خواهند داشت و نتایج آن را غیر قابل اعتماد می کنند. تحقیق پیش رو به اجرا و...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان فارس - دانشکده علوم پایه

کلمات کلیدی

تحقیق در عملیات فاصله هاسدورف داده کاوی داده دورافتاده عدد فازی حلقه های تودرتو الگوریتم k نزدیکترین همسایه

میزبانی شده توسط پلتفرم ابری doprax.com