نام پژوهشگر: آرمین دانش پژوه

شناسایی اختلاس بر پایه روش یادگیری نیمه نظارتی با استفاده از داده های بدون برچسب و داده هایی با برچسب مثبت
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1392
  آرمین دانش پژوه   اشکان سامی

در سالهای اخیر، اختلاس مالی 1 که شامل سوء استفاده از کارتهای اعتباری، کلاهبرداریهای دست جمعی و انتقال و گردش غیر قانونی پول می شود، توجه زیادی را به خود جلب کرده است. فرهنگ لغت آکسفورد ] 1 [ واژه اختلاس را به صورت زیر تعریف کرده است: "عملکرد فریبکارانه ای که به صورت غیر قانونی و مجرمانه در جهت منافع مالی و یا شخصی انجام می گردد."همچنین اختلاس به معنای سوء استفاده از سیستم های یک سازمان برای کسب منافع از طریق فرآیندهای غیر قانونی نیز تفسیر شده است ] 2 [ . اگرچه هنوز معنای قابل قبولی در سطح جهانی برای اختلاس مالی وجود ندارد، در ] 3 [ اختلاس اینگونه تعریف شده است: "عملی که خلاف قانون، مقررات و رویه یک مجموعه بوده و به صورت تعمدی و در جهت کسب منفعت مالی غیر مجاز صورت می گیرد." از لحاظ اقتصادی، اختلاس مالی به یک مشکل بسیار بزرگی تبدیل شده است. سرآمد اینگونه فعالیت ها مربوط می شود به طرح ponzi ، که توسط berbard madoff رئیس سابق nasdaq جاودانه شده است. این طرح منجر به زیانی معادل تقربیاً 5 میلیارد دلار در سراسر جهان شد ] 4 [. مثالی دیگر از این فعالیت ها، مسئله joseph hirko ، مدیر اجرایی شرکت enron broadband services(ebs) 8 میلیون دلار اعتراف کرده بود / است که در دادگاه به اختلاس نزدیک به 7 ] 4 [ . بر اساس گزارش اخبار bbc در سال 2557 کلاهبرداری های انجام شده از طریق شرکت های بیمه انگلیس، باعث ضرر 1 میلیارد پوند در سال شده است / کردن این شرکت ها به میزان 6 ] 0 [ . به طور کلی ضررهای ناشی از اختلاس های مالی قابل محاسبه نیست ] 6 [ . شناسایی اختلاس مالی یک مسئله حیاتی در زمینه جلوگیری از عواقب ویران کننده این گونه اختلاس ها می باشد. شناسایی اختلاس های مالی شامل تمییز دادن بین داده های مالی نادرست از داده های مالی موثق می باشد که در نتیجه آن بتوان رفتارها و عملکردهای کلاهبردارانه را فاش کرد و افراد تصمیم گیرنده را قادر ساخت تا برای کاهش اثرات اختلاس، استراتژی های مناسبی را اتخاذ کنند. داده کاوی نقش مهمی در شناسایی اختلاس مالی دارد. برای مثال، داده کاوی اغلب برای استخراج و کشف کردن حقایق پنهان درون داده های با کمیت بسیار زیاد به کار می رود. در ] 7 [ داده کاوی به عنوان پروسه ای در جهت شناسایی الگوهای جالب توجه در پایگاه های داده که می توانند در تصمیم سازی مورد استفاده قرار گیرند، تعریف شده است. همچنین در ] 8 [ تعریف داده کاوی اینگونه آمده است: پروسه ای که با استفاده از آمار، ریاضیات، هوش مصنوعی، و تکنیک های یادگیری ماشین به استخراج و شناسایی اطلاعات مفید و متعاقباً به دست آوردن دانش از پایگاه داده بزرگ می پردازد. در ] 9 [ ذکر شده است که هدف داده کاوی بدست آوردن اطلاعات مفید و غیر واضح از داده های ذخیره شده در انبارهای بزرگ می باشد. همچنین در ] 15 [ یکی از مزایای مهم داده کاوی، ساخت و توسعه کلاسی جدید از مدلها جهت شناسایی حمله های جدید قبل از شناسایی توسط افراط خبره ذکر شده است. شناسایی اختلاس به یکی از بهترین کاربردهای ثابت داده کاوی هم در زمینه صنعتی و هم دولتی مبدل شده است. تکنیک های مختلفی از داده کاوی در زمینه کشف اختلاس به کار رفته است. از جمله آنها می توان به شبکه های عصبی، مدلهای رگرسیون، روش naïve baye و درختهای تصمیم گیری 2 ] 11 [ اشاره کرد.