فریبا مینایی بیدگلی

نام پژوهشگر: فریبا مینایی بیدگلی

استفاده از داده کاوی برای کشف الگوهای پنهان در داده های سرطان سینه (بیمارستان شهید رجایی آران و بیدگل)

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - دانشکده فنی مهندسی 1390
فاطمه طباطبایی بهروز مینایی بیدگلی

سرطان، یکی از دلایل اصلی مرگ در سراسر جهان است. در این بیماری، سلول های بدن به صورت غیر قابل کنترل رشد می کنند. گروهی از سلول هایی که به سرعت تکثیر شده اند، ممکن است یک توده، جرم یا بافت اضافی ایجاد کنند. این توده ها، تومور نامیده می شوند. توده ها می توانند سرطانی یا غیرسرطانی باشند. سرطان سینه، دومین عامل مرگ زنان است. این بیماری در میان مردان و زنان دیده شده، گرچه موارد ابتلا در میان مردان نادر است. در ایران نیز سرطان سینه، شایع ترین سرطان در میان زنان است. البته میزان ابتلا به این بیماری در ایران، بسیار کمتر از آمریکا و سایر کشورهای اروپایی است. همچنین سن ابتلا به این بیماری در ایران، نسبت به کشورهای توسعه یافته، یک دهه پائین تر است. فاکتور اصلی در کاهش مرگ و میر ناشی از این بیماری، تشخیص سریع و صحیح است. در این تحقیق، یک سیستم رده بندی ارائه شده که می تواند در تشخیص تومور به پزشکان کمک کند. به علت چند رده ای و نامتوازن بودن داده های مورد استفاده در این تحقیق، رهیافت جدیدی برای یادگیری در داده های چند رده ای و نامتوازن ارائه شده است. حساسیت سیستم رده بندی ارائه شده، 86.53 درصد و دقت آن، 89.25 درصد می باشد. همچنین در این تحقیق با استفاده از الگوریتم apriori، به شناسایی عوامل موثر در بروز توده های خوش خیم و بدخیم پرداخته شده و عوامل افزایش سن، منارک زودرس، یائسگی دیررس، داشتن سن بالا هنگام اولین بارداری، سابقه ی طولانی مدت مصرف قرص های ضدبارداری، چاقی، نداشتن سابقه ی بارداری، زایمان و شیردهی و تعداد دفعات شیردهی بالا، به عنوان عوامل موثر در بروز توده، شناخته شده اند. اگر چه بیشتر این عوامل قبلا به عنوان فاکتورهای خطرزا در بروز سرطان سینه معرفی شده بودند، فاکتور تعداد دفعات شیردهی بالا، در این مطالعه به عنوان یک فاکتور خطرزا تعیین گردیده که با یافته های محققان قبلی در تعارض می باشد. این مسئله می تواند به دلیل تعداد بسیار اندک نمونه های مبتلا به تومور بدخیم باشد.

۱۵ صفحه ی اول

به کارگیری داده کاوی برای کشف الگوهای پنهان در داده های مامایی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه قم - پژوهشکده فنی و مهندسی 1391
فاطمه کیامهر بهروز مینایی بیدگلی

پیش بینی اولیه و درست عوارض مادر بعد از زایمان، یکی از مسائل مهم برای مادران و متخصصین زنان می باشد. اگر چه عوامل بسیاری که بر روی عوارض مادر تاثیر دارند، شناخته شده است اما شناخت عوارض به طور شهودی و مستقیم برای بهینه سازی میزان موفقیت هر مادر برای متخصصین زنان مشکل است. این پایان نامه روش های هوشمند ترکیبی (تجمیع انتخاب ویژگی و الگوریتم apriori) که برای کاوش دانش داده های مامایی است، ارائه می دهد. روش پیشنهاد شده نه تنها به متخصصین زنان در پیش بینی عوارض مادر کمک می کند بلکه دانش مفیدی است که می تواند به متخصصین زنان برای سازماندهی عوارض مادر به منظور بهبود میزان موفقیت زایمان هر مادر کمک نماید. مهمترین ویژگی ها برای ارزیابی زایمان (نظیر : سن مادر، نوع زایمان، مدت درد زایمان و تعداد زایمان قبلی و غیره) و روابط ترکیبی آنها (که به صورت قوانین اگر- آنگاه ارائه شده است). در این پایان نامه، مسئله یادگیری داده های به شدت نامتوازن، مورد مطالعه قرار گرفته است. روش های رده بندی سنتی، به دنبال به حداقل رساندن میزان کلی خطا از کل مجموعه ی آموزش، بر روی داده های نامتوازن به خوبی عمل نمی کند. به طور کلی، برخورد با رده اقلیت نیاز به مفاهیم جدید، بررسی ها و راه حل هایی به منظور درک کامل از مدل های اساسی پیچیده دارد. در این پایان نامه، توجه بخصوصی به مسئله رده بندی دودویی نامتوازن شده است و چندین روش یادگیری ترکیبی موثر برای حل این مسئله پیشنهاد شده است. تمرکز این پایان نامه بر کشف قوانین متقابل جالب می باشد که توصیف کننده ی خصوصیات جالب مجموعه ای از قوانین عطفی بخش های مختلف می باشد. ما از فرمول کلی قوانین متقابل، همانند یک چارچوب برای یافتن چنین الگوهایی استفاده نمودیم. در زمینه ی مجموعه داده های مامایی، قوانین متقابل به شناسایی اختلاف عملکرد ویژگی های الگو میان گروه های مختلف زایمان مادران کمک می کند. در برنامه ی کاربردی داده کاوی، این آسان است تا تعداد زیادی از الگوها را کشف نماییم؛ بسیاری از این الگوها عملاً بی فایده یا غیر جذاب هستند؛ اما با توجه به تعداد زیاد الگوها، درک تمام الگوها و شناسایی الگوهای جالب بسیار دشوار است. تعداد زیاد الگوها و تکنیک ها، نیازمند تجزیه و تحلیل و رتبه بندی الگوها با توجه به جذابیتشان هستند. این پایان نامه چنین تکنیکی را پیشنهاد می کند، این تکنیک مبتنی بر تطابق فازی الگوهای کشف شده با مجموعه ای از الگوهای مشخص شده توسط استفاده کننده می باشد.