شناسایی اختلاس بر پایه روش یادگیری نیمه نظارتی با استفاده از داده های بدون برچسب و داده هایی با برچسب مثبت

پایان نامه
چکیده

در سالهای اخیر، اختلاس مالی 1 که شامل سوء استفاده از کارتهای اعتباری، کلاهبرداریهای دست جمعی و انتقال و گردش غیر قانونی پول می شود، توجه زیادی را به خود جلب کرده است. فرهنگ لغت آکسفورد ] 1 [ واژه اختلاس را به صورت زیر تعریف کرده است: "عملکرد فریبکارانه ای که به صورت غیر قانونی و مجرمانه در جهت منافع مالی و یا شخصی انجام می گردد."همچنین اختلاس به معنای سوء استفاده از سیستم های یک سازمان برای کسب منافع از طریق فرآیندهای غیر قانونی نیز تفسیر شده است ] 2 [ . اگرچه هنوز معنای قابل قبولی در سطح جهانی برای اختلاس مالی وجود ندارد، در ] 3 [ اختلاس اینگونه تعریف شده است: "عملی که خلاف قانون، مقررات و رویه یک مجموعه بوده و به صورت تعمدی و در جهت کسب منفعت مالی غیر مجاز صورت می گیرد." از لحاظ اقتصادی، اختلاس مالی به یک مشکل بسیار بزرگی تبدیل شده است. سرآمد اینگونه فعالیت ها مربوط می شود به طرح ponzi ، که توسط berbard madoff رئیس سابق nasdaq جاودانه شده است. این طرح منجر به زیانی معادل تقربیاً 5 میلیارد دلار در سراسر جهان شد ] 4 [. مثالی دیگر از این فعالیت ها، مسئله joseph hirko ، مدیر اجرایی شرکت enron broadband services(ebs) 8 میلیون دلار اعتراف کرده بود / است که در دادگاه به اختلاس نزدیک به 7 ] 4 [ . بر اساس گزارش اخبار bbc در سال 2557 کلاهبرداری های انجام شده از طریق شرکت های بیمه انگلیس، باعث ضرر 1 میلیارد پوند در سال شده است / کردن این شرکت ها به میزان 6 ] 0 [ . به طور کلی ضررهای ناشی از اختلاس های مالی قابل محاسبه نیست ] 6 [ . شناسایی اختلاس مالی یک مسئله حیاتی در زمینه جلوگیری از عواقب ویران کننده این گونه اختلاس ها می باشد. شناسایی اختلاس های مالی شامل تمییز دادن بین داده های مالی نادرست از داده های مالی موثق می باشد که در نتیجه آن بتوان رفتارها و عملکردهای کلاهبردارانه را فاش کرد و افراد تصمیم گیرنده را قادر ساخت تا برای کاهش اثرات اختلاس، استراتژی های مناسبی را اتخاذ کنند. داده کاوی نقش مهمی در شناسایی اختلاس مالی دارد. برای مثال، داده کاوی اغلب برای استخراج و کشف کردن حقایق پنهان درون داده های با کمیت بسیار زیاد به کار می رود. در ] 7 [ داده کاوی به عنوان پروسه ای در جهت شناسایی الگوهای جالب توجه در پایگاه های داده که می توانند در تصمیم سازی مورد استفاده قرار گیرند، تعریف شده است. همچنین در ] 8 [ تعریف داده کاوی اینگونه آمده است: پروسه ای که با استفاده از آمار، ریاضیات، هوش مصنوعی، و تکنیک های یادگیری ماشین به استخراج و شناسایی اطلاعات مفید و متعاقباً به دست آوردن دانش از پایگاه داده بزرگ می پردازد. در ] 9 [ ذکر شده است که هدف داده کاوی بدست آوردن اطلاعات مفید و غیر واضح از داده های ذخیره شده در انبارهای بزرگ می باشد. همچنین در ] 15 [ یکی از مزایای مهم داده کاوی، ساخت و توسعه کلاسی جدید از مدلها جهت شناسایی حمله های جدید قبل از شناسایی توسط افراط خبره ذکر شده است. شناسایی اختلاس به یکی از بهترین کاربردهای ثابت داده کاوی هم در زمینه صنعتی و هم دولتی مبدل شده است. تکنیک های مختلفی از داده کاوی در زمینه کشف اختلاس به کار رفته است. از جمله آنها می توان به شبکه های عصبی، مدلهای رگرسیون، روش naïve baye و درختهای تصمیم گیری 2 ] 11 [ اشاره کرد.

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

شناسایی حرکات انسان در داده های ویدئویی با استفاده از روشهای یادگیری نیمه نظارتی

شناسایی حرکت انسان در داده های ویدئویی به عنوان یک موضوع پژوهشی مهم در حوزه بینایی ماشین، توجه بسیاری از محققان را به خود جلب کرده است. استخراج اطلاعات حرکتی انسان در ویدئو سبب کشف الگوهای مفید می شود که توسط آن ها می توان به طبقه بندی و خوشه بندی داده های ویدئویی پرداخت. بازشناسی و فهم خودکار اعمال انسان یک نیاز رو به افزایش در حوزه های کاربردی مهمی نظیر سیستم های امنیتی و نظارتی به ویژه در مک...

رخدادکاوی در داده های ویدئویی با استفاده از روش های یادگیری نیمه نظارتی

امروزه حجم زیادی از داده های ویدئویی در دسترس افراد است؛ داده های ویدئویی هم اکنون بیش از نیمی از ترافیک اینترنت را به خود اختصاص داده اند. سالانه 9000ساعت محصولات سینمایی و 8 میلیون ساعت محصولات تلویزیونی تولید می شود، این در حالی است که پیش بینی می شود تا سال 2014 بیش از 90% ظرفیت شبکه جهانی اینترنت به انتقال داده های ویدئویی اختصاص یابد. برای دسترسی کارا به این حجم عظیم داده، نیاز شدیدی به ا...

15 صفحه اول

شناسایی خطاهای داده های خام بویه های موج نگار با استفاده از روش ضریب داده پرت محلی

استخراج مشخصات دریا معمولاً از طریق بویه‌های موج نگار انجام می‌شود. اما ثبت داده توسط موج نگارها معمولاً با خطاهایی همراه است. لذا قبل از استخراج هرگونه اطلاعاتی لازم است این خطاها را شناخت و آنها را حذف و یا تصحیح کرد. هدف از این تحقیق، شناسایی خطاهای موجود در برداشت داده-های خام از بویه‌های موج نگار، با استفاده از روش ضریب داده پرت محلی (LOF) است. LOF روشی قدرتمند جهت شناسایی ناهنجاری داده‌ها د...

متن کامل

یادگیری نیمه نظارتی کرنل مرکب با استفاده از تکنیک‌های یادگیری معیار فاصله

Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown t...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023