ارایه یک روش جدید انتشار داده‌ها با حفظ محرمانگی با هدف بهبود دقّت طبقه‌‌بندی روی داده‌های گمنام

نویسندگان

چکیده مقاله:

Data collection and storage has been facilitated by the growth in electronic services, and has led to recording vast amounts of personal information in public and private organizations databases. These records often include sensitive personal information (such as income and diseases) and must be covered from others access. But in some cases, mining the data and extraction of knowledge from these valuable sources, creates the need for sharing them with other organizations. This would bring security challenges in user’s privacy. The concept of privacy is described as sharing of information in a controlled way. In other words, it decides what type of personal information should be shared and which group or person can access and use it. “Privacy preserving data publishing” is a solution to ensure secrecy of sensitive information in a data set, after publishing it in a hostile environment. This process aimed to hide sensitive information and keep published data suitable for knowledge discovery techniques. Grouping data set records is a broad approach to data anonymization. This technique prevents access to sensitive attributes of a specific record by eliminating the distinction between a number of data set records. So far a large number of data publishing models and techniques have been proposed but their utility is of concern when a high privacy requirement is needed. The main goal of this paper to present a technique to improve the privacy and performance data publishing techniques. In this work first we review previous techniques of privacy preserving data publishing and then we present an efficient anonymization method which its goal is to conserve accuracy of classification on anonymized data. The attack model of this work is based on an adversary inferring a sensitive value in a published data set to as high as that of an inference based on public knowledge. Our privacy model and technique uses a decision tree to prevent publishing of information that removing them provides privacy and has little effect on utility of output data. The presented idea of this paper is an extension of the work presented in [20]. Experimental results show that classifiers trained on the transformed data set achieving similar accuracy as the ones trained on the original data set.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

حفظ محرمانگی در انتشار سری های زمانی پزشکی: k-گمنام سازی چندجزئی ها

صاحبان اطلاعات در حوزه سلامت نیاز دارند تا داده های عملیاتی خود را برای مقاصدی همچون مشاوره یا تحقیقات بیشتر منتشر نمایند. در نتیجه، امروزه حجم زیادی از اطلاعات اشخاص با جزئیات کافی به صورت عمومی در دسترس قرار دارد. این داده ها ممکن است شامل سری های زمانی، همچون سیگنال الکتروکاردیوگرام، نیز باشد. در این موارد حذف شناسه از داده های سری زمانی به تنهایی برای حفظ محرمانگی آنها کافی نیست. زیرا اگر ت...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

یک روش جدید افزایش دقت مکانی تصاویر سنجش از دور با استفاده از جدول جستجو

Different methods have been proposed to increase the image spatial resolution by mixed pixels decomposition. These methods can be divided into two groups. Some research have been attempted to obtain percentages of sub pixels and the other try to obtain their locations. These methods and their problems will be examined in this study. Common methods are reviewed with more emphasis. Finally, a new...

متن کامل

مصرف مواد، یک انتخاب منطقى با هدف بهبود زندگى؟

«فرضیّه‌ى انتخاب منطقى» یکى از فرضیّات علم اقتصاد است که پس از مدت کوتاهى به علوم اجتماعى، سیاسى و انسان شناسى نیز راه یافت و در این علوم براى درک و توجیه بعضى از پدیده‌ها مورداستفاده قرار گرفت. بر اساس این فرضیّه، مبناى تصمیم گیرى افراد، بهبود شرایط، کسب لذت و دفع رنج است. افراد در هر تصمیم گیرى، همواره محاسبات لازم را انجام مى دهند و سپس بر اساس نتیجه‌ى این محاسبات، یک تصمیم منطقى اتخاذ مى...

متن کامل

بهبود دقت طبقه‌بندی با استفاده از تلفیق الگوریتم‌های تشخیص هدف در تصاویر ابرطیفی

تصاویر ابرطیفی با قدرت تفکیک طیفی بالا باعث پیشرفت‌های وسیعی در حوزه‌های مختلف سنجش از دور شده‌اند. یکی از مهمترین کاربردهای این تصاویر در حوزه کشاورزی و جنگل می‌باشد. هدف از این تحقیق بهبود طبقه‌بندی گونه‌های مختلف گیاهی در منطقه Botswana با استفاده از تلفیق الگوریتم‌های تشخیص هدف در تصویر ابرطیفی می‌باشد. در گام اول الگوریتم‌های تشخیص هدف بر روی تصویر ابر طیفی پیش‌پردازش شده پیاده‌سازی شد. در...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 15  شماره 3

صفحات  31- 46

تاریخ انتشار 2018-12

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023