ارائه روشی مبتنی بر آشفتگی جهت کاوش داده های حساس با حفظ محرمانگی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی
  • نویسنده پردیس تقوی
  • استاد راهنما محمدرضا کیوان پور
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1393
چکیده

با پیشرفت های اخیر در فرایند ارتباطات و ذخیره سازی داده، میزان زیادی از اطلاعات جمع آوری و ذخیره شده است. چنین میزان گسترده ای از داده ها فرصت های زیادی برای کشف دانش ایجاد می کنند. اگرچه، اطلاعات تقریبا همیشه تحت برخی ملاحظات حفظ حریم خصوصی جمع آوری شده است، اما در سال های اخیر افزایش نگرانی ها درمورد محرمانگی باعث شده است که صاحبان داده ها تمایل به اشتراک گذاری داده هایشان و ایجاد انباره های داده ی اشتراکی نداشته باشند. وجود محدودیت مذکور در جمع آوری داده ها می تواند در میزان موفقیت فرایند داده کاوی اثر منفی داشته باشد، بنابراین انجام داده کاوی با حفظ محرمانگی مسأله پژوهشی مهمی تلقی می شود. یکی از مهم ترین راهکارها جهت حفظ محرمانگی در داده کاوی، روش های مبتنی بر آشفتگی داده است. چالش عمده این دسته از روش ها عدم تعادل مطلوب بین حفظ محرمانگی و دقت داده هاست. براین اساس، تحقیقاتی مبتنی بر روش های تجزیه ماتریس، در راستای رفع چالش فوق و ایجاد تعادل مناسب بین حفظ محرمانگی داده و حفظ سودمندی داده ها صورت گرفته است. اما معمولا در روش های مبتنی بر تجزیه ماتریس، همه داده ها با درجه یکسانی تحریف می شوند، در صورتیکه تمام داده ها اهمیت یکسانی برای داده کاوی ندارند و همه آنها نیازمند یک سطح محرمانگی نیستند. در این پژوهش، در راستای بهبود روش های مبتنی بر آشفتگی، مدلی جدید ارائه شده است. در روش پیشنهادی با استفاده از روش های انتخاب ویژگی تمام ویژگی های مجموعه ی داده بر حسب اهمیتشان برای داده کاوی، به دو گروه تقسیم شده و هر کدام از این گروه ها با مرتبه ی متفاوتی آشفته می شوند. همچنین به منظور جبران کاهش دقت ناشی از تحریف داده ها، از روش های شفاف سازی استفاده شده است. آزمون های مختلف و تحلیل نتایج حاصل از آنها نشان می دهد که روش پیشنهادی ارائه شده، نسبت به روش های پیشین، موجب بهبود سطح حفظ محرمانگی داده ها و دقت نتایج داده کاوی شده است. به بیان دیگر روش پیشنهادی تعادل مطلوبی را بین حفظ محرمانگی و سودمندی داده ها ایجاد می کند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ارائه مدلی جهت حفظ محرمانگی در پردازش داده های کلان

امروزه منابع اطلاعاتی به منابعی مشخص و از پیش تعیین شده محدود نمی شوند و هرگونه اطلاعی همچون ترافیک شبکه، اطلاعات مربوط به پست الکترونیک، رفتار مشتری در هنگام خرید و سایر موارد، می توانند به عنوان یک منبع اطلاعاتی قابل توجه، مد نظر قرار گیرند. بنابراین، برای سازگاری با این عصر جدید در داده ها که به عنوان عصر داده های کلان مطرح می شود، نیازمند زیرساخت ها و تکنیک های جدیدی هستیم که بتوانند با ویژ...

ارائه الگوریتمی برای حفظ محرمانگی داده ها در مقابل فرایند استخراج الگوهای پدیدارشونده حساس میان دو مجموعه داده

جمع آوری و نگهداری حجم بزرگی از داده های مرتبط در کاربردهای گوناگون تجاری و صنعتی، این فرصت را به صاحبان داده می دهد تا بتوانند با استفاده از روش های پیچیده داده کاوی به تحلیل و استخراج دانش موجود در این داده های خام پرداخته و از نتایج حاصل در راستای رشد و ترقی خود و یافتن برتری نسبت به رقبا، استفاده کنند. تمایز کاوی یکی از روش های جدید داده کاوی است که هدف آن کشف کردن تمایزهای میان دو یا چند م...

حفظ محرمانگی داده ها در داده کاوی

داده کاوی فرآیند انتخاب، اکتشاف و مدل کردن مقدار زیاد و متنوعی از داده ها برای کشف قوانین و ارتباط بین آنها به منظور استخراج نتایج مفید برای صاحبان پایگاه داده ها است. دانش حاصل از داده کاوی موضوع جدیدی است که اخیراً در پایگاه داده ها مطرح شده است. این دانش، از اطلاعات شخصی افراد استخراج می شود. در سال های اخیر روش های داده کاوی با معضل مهم محافظت از داده های حساس، از جمله داده های بانکی، پزشکی ...

ارائه روشی جهت پیش‌بینی اسلامپ بتن مبتنی بر مدل نروفازی تطبیقی

کارایی بتن از اهمیت بسیار بالایی در پروژه‌های عمرانی برخوردار است. یکی از متداول‌ترین روش‌ها جهت اندازه گیری کارایی بتن، آزمایش اسلامپ است. جهت صرفه‌جویی در زمان، هزینه و مصالح، بهتر است از روش‌های هوشمندی جهت پیش‌بینی اسلامپ بتن استفاده شود. در این تحقیق یکی از روش‌های مبتنی بر محاسبات نرم بکار گرفته می‌شود تا با طراحی شبکه‌ای، بدون نیاز به انجام آزمایش‌های فیزیکی پرزحمت، بتوان تخمینی از اسلام...

متن کامل

زمانبندی در محاسبات ابری ترکیبی با حفظ محرمانگی داده ها

به کار گیری فناوری ابرهای محاسباتی از بدو ابداع تا به امروز رو به رشد بوده و این روند با شتاب ادامه دارد. در این میان کلیه سازمانهای تجاری و تحقیقاتی در ابعاد بزرگ، متوسط و یا حتی کوچک خواهان این هستند که خود را با این فناوری که در مرزهای علم قرار گرفته است تطبیق دهند. استفاده از ابر خصوصی برای اجرای برنامه های جریان کاری ، کاهش هزینه و محرمانگی بیشتر اطلاعات سازمان را به دنبال خواهد داشت؛ در ح...

ارائه روشی مبتنی بر الگوریتم‌های هوشمند برای حل پخش‌بار احتمالی جهت برنامه‌ریزی و بهره‌برداری از ریزشبکه‌ها

One of the basic components of future distribution networks are renewable energy resources (RER). The uncertainty in power production of renewable resources such as wind and solar as well as load is another characteristic of such networks. Conventional power flow methods as a basic tool for power system studies may not be suitable for active distribution networks such as microgrids. In this pap...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023