نام پژوهشگر: زهره احمدی دستجردی

توسعه فازی الگوریتم apriori برای کاوش قوانین وابستگی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان 1390
  زهره احمدی دستجردی   محمد حسین سرایی

در دنیای کنونی، اطلاعات به عنوان یکی از فاکتورهای تولیدی مهم مطرح است. در نتیجه، تلاش برای استخراج اطلاعات از داده ها از جمله چالش های اساسی در صنعت اطلاعات و حوزه های وابسته به آن است. حجم داده ها دائماً در حال رشد است و در همه ی محیط ها و به صورت متنوع در قالب های مختلف وجود دارد، که این نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. داده کاوی یکی از پیشرفت های اخیر در زمینه فناوری مدیریت داده هاست. در دادهکاوی ?تئوریهای پایگاهدادهها، هوش مصنوعی، یادگیری ماشین و علم آمار را در هم میآمیزند تا زمینهای کاربردی فراهم شود. داده کاوی روش های مختلفی دارد که از جمله مهمترین آنها قوانین وابستگی است. یکی از الگوریتم های رایج برای کشف قوانین وابستگی الگوریتم apriori است. تاکنون مطالعات متعددی جهت توسعه کاوش قوانین وابستگی صورت گرفته است که پایه بسیاری از آنها، الگوریتم apriori بوده است. آنچه دراین تحقیق بر آن تأکید می شود نگاهی جدید بر مبنای منطق فازی جهت کشف قوانین وابستگی است. پس از مطرح شدن منطق فازی، استفاده از آن در سیستم های هوشمند به دلیل شباهت با نحوه استدلال انسان به سرعت وارد داده کاوی شد. در مقایسه با منطق کلاسیک، منطق فازی جهان بینی نوینی است که با نیازهای دنیای پیچیده امروز سازگارتر است. در این نظریه درستی گزاره ها عددی بین صفر و یک است در صورتی که در منطق کلاسیک گزاره ها یا درست و یا غلط هستند. لذا نتایج حاصل از منطق فازی در مسائل متعدد، کاربردی تر و واقعی تر خواهد بود. در این تحقیق ضمن مطالعه کارهای انجام شده تاکنون و بررسی نقاط ضعف و قوت آنها، همچنین بررسی مسائل کاربردی و مطرح کنونی، الگوریتمی جدید با نام ftarm برای کشف قوانین وابستگی فازی از روی مجموعه دادههای عددی مختلف، با در نظر گرفتن یک طبقهبندی چندسطحی فازی روی دادهها و همچنین قابلیت متفاوت در نظر گرفتن کمترین پشتیبان به ازای اقلام مختلف پیشنهاد شده است. یکی از ایده های مهم به کار رفته در این الگوریتم توانایی آن در استفاده روی مجموعه داده های مختلف با انواع متنوعی از مشخصه ها اعم از مشخصه های گسسته و پیوسته است. قابلیت الگوریتم ارائه شده در لحاظ نمودن طبقه بندی فازی و کشف قوانین وابستگی در تمام سطوح آن با در نظر گرفتن فرض های فوق یکی از نقاط قوت پرکاربرد آن است. همچنین در این تحقیق یک روش برای به دست آوردن طبقه بندی فازی بر مبنای روش چند متغیره آماری تحلیل عاملی ارائه شده است. استفاده از این روش به منظور استخراج طبقه بندی فازی در مواردی توصیه می گردد که طبقه بندی در دسترس نبوده و یا تولید آن مشکل باشد. از این رو با کمک تحلیل عاملی می توان به استخراج طبقه بندی فازی پرداخت. این روش با تقسیم بندی شاخص های سطح پایین تر، عوامل پنهان را در سطح بالاتر طبقه بندی تولید می نماید. روش های فوق بر روی دو مثال کاربردی به منظور نشان دادن کارکرد الگوریتم پیاده سازی شده است. مثال اول در زمینه هواشناسی و شامل داده های میانگین دمای هوای ماهیانه 26 شهر کشور ایران در بین سال های 1990 تا 2000 میلادی است. مثال دوم برگرفته از حمل و نقل جاده ای کشور بوده و در آن 14 شاخص مهم در زمینه ایمنی حمل و نقل جاده ای کشور در سال 1387 مورد استفاده قرار گرفته است.