نام پژوهشگر: کاوه آهنگربیک

استفاده از تکنیک های داده کاوی به منظور پیش آگهی سرطان پانکراس
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشکده علوم اقتصادی - دانشکده مدیریت و اقتصاد 1392
  کاوه آهنگربیک   جمال شهرابی

کشف دانش در پایگاهای داده فرآیند جستجوی خودکارِ مقادیر عظیم داده ها را برای یافتن الگوهای پنهانِ درون داده ها توصیف می کند به طوری که این الگوها می توانند به عنوان دانش درون داده ها تعبیر شوند . داده کاوی به عنوان گام های تحلیلیِ کشف دانش در پایگاه های داده در نظر گرفته می شود به طوری که این گام ها از پیش پردازش ، یادگیری ماشین و تحلیل نتایج تشکیل می شود . پیش پردازش داده ها ، داده های سطریِ ورودی را به طور ساده شده و موثری برای استفاده در مرحله ی یادگیری ماشین آماده می کند . این گام شامل پاکسازی داده ها ، تبدیل داده ها و کاهش ویژگیِ داده ها می باشد . یادگیری ماشین شاخه ای از علوم و مهندسی کامپیوتر می باشد که به طراحی و توسعه ی الگوریتم هایی می پردازد که توانایی یادگیری مصنوعی را دارد ؛ این الگوریتم های توسعه یافته به دو صورت تکنیک های یادگیری با ناظر و بدون ناظر می باشد . این پایان نامه بر روی استفاده از تکنیک های داده کاوی برای تعیین زمان بقای مورد انتظار بیماران مبتلا به سرطان پانکراس (لوزالمعده) به منظور تعیین نوع عمل انجام شده بر روی بیماران مبتلا به این نوع سرطان ، تمرکز کرده است . در این پایان نامه از داده های بالینی بیمار برای نشان دادن روند کلیِ رفتارها و برآمد های حاصل از بیماری استفاده شده است . در مطالعات پزشکی ، به طور سنتی ، از روش های آماری برای ساخت مدل های پیش بینی کننده بر حسب متغیرهای پیشگو یا همان مشخصه ها استفاده می شود . در این تحقیق از ماشین بردار پشتیبان و مدل ترکیبی آن یعنی ماشین بردار پشتیبان فازی برای ایجاد مدلی بر روی داده های بالینی سرطان پانکراس به منظور تعیین زمان بقای مورد انتظار بیماران مبتلا به سرطان پانکراس استفاده شده است . به علت تعداد بالای مشخصه های مساله ، در مرحله ی پیش پردازش داده ها از یک فرآیند انتخاب مشخصه بر مبنای دو روش wrapper و filter استفاده شده است . در نهایت برای بالا بردن دقت ماشین های بردار پشتیبان استاندارد و فازی از روش های bagging و adaboost استفاده می شود . در واقع مدل پیشنهاد شده در این پایان نامه دارای 2 زیر مدل می باشد ، یک مدل برای مرحله ی پیش پردازش داده ها و مدل دیگر برای مرحله ی یادگیری ماشین . نتایج تحقیق نشان می دهد که مدل پیشنهاد شده برای این مساله داده کاوی ، می تواند با دقت بالایی زمان بقای مورد انتظار بیماران مبتلا به سرطان پانکراس را تعیین کند .