تجزیه ی ماتریس برای داده کاوی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز
  • نویسنده فاطمه نیکومرام
  • استاد راهنما اشکان سامی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1390
چکیده

تجزیه ی ماتریس دارای کاربردهای زیادی نظیر: کاهش بعد، تشخیص الگو، آنالیز بیان ژن و ... می باشد. از آنجا که دربسیاری از کاربردها مانند تشخیص چهره، عناصر منفی وجود و معنا ندارند، تجزیه غیرمنفی و باینری ماتریس پیشنهاد داده شده است. در تجزیه ماتریس باینری، همه ی عناصر باینری هستند و جمع و ضرب نیز در فضای باینری تعریف می شوند. از بین انواع تجزیه باینری، تجزیه ستونی باینری ماتریس که توسط میئتنین ارائه شده است، دارای قابلیت تفسیر بالایی است. بنابراین، این روش، بهترین روش جهت استخراج قوانین است. در این روش، ماتریس ورودی به دو ماتریس c و x که یکی شامل k ستون و دیگری شامل k ردیف است، تجزیه می شود، به طوری که k تعداد خوشه ها و یا دسته ها می باشد. k ستون ماتریس اول، c، زیرمجموعه ای از ستون های ماتریس ورودی می باشند. بنابراین قابلیت تفسیر بالا است. دو چالش در این نوع تجزیه وجود دارد: 1) الگوریتم های پیشنهاد شده برای این روش، برای رسیدن به خطای کمتر از تعداد تکرار زیاد رنج می برند و حتی امکان دارد الگوریتم، بعد از تکرارهای بیشتر به جواب بدتر برسد. 2) از قابلیت تفسیر بالای این تجزیه در کاربردی استفاده نشده است. این پایان نامه دو هدف دارد: 1) بهبود الگوریتم های موجود. 2) ارائه کاربرد. در زمینه ی بهبود الگوریتم، دو روش برای بهبود در الگوریتم bcx ارائه شده است. یک روش، جهت بهبود در یافتن ماتریس c و یک بهبود در ماتریس x به وجود آمده، پیشنهاد شده است، که اثبات ریاضی برای این بهبود نیز ارائه شده است. انتخاب ستون های ماتریس c طوری بازبینی شده است که منجر به خطای کمتر می شوند و بهبود در ماتریس x، از تعریف ضرب ماتریس الهام گرفته است. نتایج حاصل از آزمایشات دقت بالای بهبود را در kهای بالا نشان می دهد. به طوری که برای kهای بالا، درصد بهبود حدود 50% به دست آمده است. در زمینه ی کاربرد، کاربرد استخراج اتوماتیک کلمات کلیدی موردتوجه قرار گرفته است. کلمات کلیدی در بسیاری موارد به عنوان خلاصه ی مفیدی از متن استفاده می شوند. انتساب دستی این کلمات کار بسیار وقت گیری است. در عمل، کلمات کلیدی، کلماتی هستند که پوشش خوبی از متن دارند. الگوریتمی بر اساس تجزیه bcx برای استخراج بهترین کلمات متن ارائه شده است که هر چه خطای تجزیه کمتر باشد، پوشش متن بهتر است. نتایج نشان می دهد که این الگوریتم، الگوریتمی کارا و ساده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

به کارگیری تجزیه ماتریس در کاهش ابعاد داده نوع گراف:مورد کاوی داده ریزآرایه

چکیده به کارگیری تجزیه ماتریس در کاهش ابعاد داده نوع گراف: مورد کاوی داده ریز آرایه به کوشش: فهیمه گودرزی یکی از شاخه های مهم بیو انفوماتیک فناوری ریز آرایه dna است که امکان بررسی عبارت هزاران ژن را به طور هم زمان و در حداقل زمان ممکن می سازد که در سال های اخیر موجب تولید حجم انبوهی از داده های عبارت ژن شده است. تحلیل آماری این داده ها شامل نرمال سازی، خوشه بندی، طبقه بندی و ... غیر...

به کارگیری داده کاوی برای پیشنهاد پرسش درنظام‌های بازیابی اطلاعات

داده‌کاوی به مفهوم آشکارسازی الگوهای موجود در حجم انبوه داده‌هاست که در بسیاری از رشته‌ها به کار گرفته شده است. در رشته علم اطلاعات و دانش‌شناسی به ویژه در بازیابی اطلاعات نیز می‌توان از آن بهره برد. در بازیابی اطلاعات ابتدا پارادایم نظام‌گرا و سپس پاردایم کاربرگرا مطرح شده است که در پارادایم دوم به نیاز اطلاعاتی توجه شده است. در پارادایم دوم، ورود پرسش‌های نامناسب از سوی کاربران، دلیل اصلی عدم...

متن کامل

تجزیه تحلیل علایم بالینی بیماران مبتلا به اِسکلروزِ چندگانه با استفاده از داده کاوی

Background: One of the today most common and incurable diseases that is associated with central neural system is ‘MS’ disease. Multiple sclerosis (MS) is a demyelinating disease in which the insulating covers of nerve cells in the brain and spinal cord are damaged. In this disease become apparent a wide spectrum of symptoms such as lose muscles control and their coordination and vision derangem...

متن کامل

داده کاوی احتمال وقوع خشک‌سالی در ایران

خشکسالی در سال‌های اخیر خسارات زیادی به کشور وارد ساخته است که باید تلاش کرد تا با استفاده از مدیریت منطقی، حتی‌الامکان خسارات ناشی از آن را کاهش داد. بدین منظور لازم است تا مناطق متأثر از این بلا مقایسه شوند و در اولویت اقدامات مدیریتی قرار گیرند. هدف از انجام این مطالعه تهیه نقشه شاخص خطر خشکسالی ایران است. در این تحقیق داده‌های بارش ماهانه 46 ایستگاه انتخاب شدند. به‌منظور تهیه نقشه شاخص DHI ...

متن کامل

بررسی کاربردهای داده کاوی در نظام سلامت

Introduction: Extensive amounts of data stored in medical databases require the development of specialized tools for accessing the data, data analysis, knowledge discovery, and the effective use of the data. Data mining is one of the most important methods. The article sketches the used Data Mining techniques, and illustrates their applicability to medical diagnostic and prognostic problems. ...

متن کامل

مدلی برای تحلیل رفتار مشتریان با استفاده از داده کاوی (مطالعه ی موردی: صنعت روغن خوراکی)

شناخت درست و حفظ مشتریان از عوامل اثرگذار در دنیای رقابت امروز است. صنایعی چون صنعت غذا به فکر هم مسیری با بازار رقابتی نوین هستند. امروزه علومی چون داده کاوی، مدیریت ارتباط با مشتری و مدیریت استراتژیک به صورت مکمل برای شناخت درست رفتار مشتری، بهبود c r m و افزایش درآمد، بهبودی بخش این موضوع اند. با استفاده از مفاهیم فوق، پژوهشی درخصوص داده های مربوط به یک شرکت تولیدی روغن انجام گرفته است. با ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023