نام پژوهشگر: پردیس تقوی

ارائه روشی مبتنی بر آشفتگی جهت کاوش داده های حساس با حفظ محرمانگی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1393
  پردیس تقوی   محمدرضا کیوان پور

با پیشرفت های اخیر در فرایند ارتباطات و ذخیره سازی داده، میزان زیادی از اطلاعات جمع آوری و ذخیره شده است. چنین میزان گسترده ای از داده ها فرصت های زیادی برای کشف دانش ایجاد می کنند. اگرچه، اطلاعات تقریبا همیشه تحت برخی ملاحظات حفظ حریم خصوصی جمع آوری شده است، اما در سال های اخیر افزایش نگرانی ها درمورد محرمانگی باعث شده است که صاحبان داده ها تمایل به اشتراک گذاری داده هایشان و ایجاد انباره های داده ی اشتراکی نداشته باشند. وجود محدودیت مذکور در جمع آوری داده ها می تواند در میزان موفقیت فرایند داده کاوی اثر منفی داشته باشد، بنابراین انجام داده کاوی با حفظ محرمانگی مسأله پژوهشی مهمی تلقی می شود. یکی از مهم ترین راهکارها جهت حفظ محرمانگی در داده کاوی، روش های مبتنی بر آشفتگی داده است. چالش عمده این دسته از روش ها عدم تعادل مطلوب بین حفظ محرمانگی و دقت داده هاست. براین اساس، تحقیقاتی مبتنی بر روش های تجزیه ماتریس، در راستای رفع چالش فوق و ایجاد تعادل مناسب بین حفظ محرمانگی داده و حفظ سودمندی داده ها صورت گرفته است. اما معمولا در روش های مبتنی بر تجزیه ماتریس، همه داده ها با درجه یکسانی تحریف می شوند، در صورتیکه تمام داده ها اهمیت یکسانی برای داده کاوی ندارند و همه آنها نیازمند یک سطح محرمانگی نیستند. در این پژوهش، در راستای بهبود روش های مبتنی بر آشفتگی، مدلی جدید ارائه شده است. در روش پیشنهادی با استفاده از روش های انتخاب ویژگی تمام ویژگی های مجموعه ی داده بر حسب اهمیتشان برای داده کاوی، به دو گروه تقسیم شده و هر کدام از این گروه ها با مرتبه ی متفاوتی آشفته می شوند. همچنین به منظور جبران کاهش دقت ناشی از تحریف داده ها، از روش های شفاف سازی استفاده شده است. آزمون های مختلف و تحلیل نتایج حاصل از آنها نشان می دهد که روش پیشنهادی ارائه شده، نسبت به روش های پیشین، موجب بهبود سطح حفظ محرمانگی داده ها و دقت نتایج داده کاوی شده است. به بیان دیگر روش پیشنهادی تعادل مطلوبی را بین حفظ محرمانگی و سودمندی داده ها ایجاد می کند.