نام پژوهشگر: احسان مولایی فرسنگی

روش هایی جدید برای حفظ محرمانگی در داده کاوی توزیع شده
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه امام رضا علیه السلام - دانشکده برق و کامپیوتر 1392
  احسان مولایی فرسنگی   مهرداد جلالی

داده کاوی علمی است که به منظور استخراج دانش جدید و مفید ازمیان دادههای حجیم معرفی شد. از این رو همواره ورودی الگوریتم های داده کاوی دادههای خام می باشند، اما در همه موارد دادهها در یک مکان ذخیره نشدهاند و در موارد زیادی دادهها در بین سرویس دهندههای مختلف پخش شدهاند، این امر نیاز به همکاری چند سرویس دهنده برای انجام کاوش را ضروری می کند که نتیجه آن داده کاوی توزیع شده است. در هر کاری که صحبت از همکاری است بحث اعتماد و اطمینان نیز مطرح خواهد بود، در اینجا نیز بحث اطمینان از حفظ دادههای خصوصی افراد حقیقی و یا حقوقی از دسترس دیگران بسیار مهم است به نحوی که بحث محرمانگی و حفظ آن به عنوان مهمترین نیاز الگوریتمهای کاوش توزیع شده مطرح است. در این پژوهش هدف ارائه روش هایی برای حفاظت از داده های مورد کاوش برای کلاس بندی، در برابر دسترسی های غیر مجاز در داده کاوی توزیع شده است. برای دسترسی به هدف مورد نظر رویکرد های مختلف در این زمینه مورد مطالعه قرار گرفتند که در نهایت تمرکز ما بر روی رویکرد توزیع محاسبات و نیز رویکردهای نسل بعد یعنی روش های توزیع شده برای داده کاوی توزیع شده معطوف گشت. در ابتدا دو روش بر پایه رویکرد توزیع محاسبات ارائه دادیم که اگر چه این روش ها مشکلات روش های قبلی را رفع کرده اند اما تبدیل کاربری الگوریتم های متمرکز و استفاده به عنوان الگوریتم توزیع شده همراه با محدودیت ها و افزایش هزینه ها خواهد بود. بنابراین در ادامه الگوریتمی پایه توزیع شده و جدید که با توجه به ماهیت توزیع شده اش مشکل حفظ محرمانگی در آن به کلی حل شده است ارائه شد. این الگوریتم که k مشابه ترین نمونه ها نام گذاری شد بعد از پیاده سازی با الگوریتم معروف k نزدیک ترین همسایه ها مقایسه شده است که برای مثال از نظر صحت، نتایجی نزدیک به یک دیگر داشته اند و از نظر هزینه محاسباتی نیز، الگوریتم پیشنهادی در اجراهای توزیع شده عملکرد بسیار بهینه تری دارد.