محمد رضا کیوان پور

ارائه یک مدل متن کاوی مبتنی بر یادگیری نیمه نظارتی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1389
مریم باحجب ایمانی محمد رضا کیوان پور

محبوبیت وب و حجم زیاد مستندات متنیِ الکترونیکی موجود، باعث افزایش نیاز به جستجو برای استخراج دانش نهان از مجموعه ی مستندات متنی شده است. بنابراین، امروزه مسئله ی متن کاوی در زمینه های متعددی از جمله پزشکی، زیست-فناوری، اقتصاد و فناوری اطلاعات مورد توجه قرار گرفته است. متن کاوی قادر است پردازش هایی مانند طبقه بندی، خوشه بندی، خلاصه سازی و استخراج اطلاعات متنی را پوشش دهد. طبقه بندی متون به شیوه ا ی مناسب با میزان خطای کم و تعمیم پذیری بالا یکی از موضوعات مهم در حوزه ی متن کاوی است. یکی از مهم ترین چالش ها در طبقه بندی متون، حجم زیاد مشخصه های مستخرج از اطلاعات متنی می باشد. یادگیری از داده هایی که مشخصه های زیادی دارند نه تنها باعث افزایش هزینه های محاسباتی می شود، بلکه کارایی یادگیری را نیز کاهش می دهد. بر این اساس استفاده از روش های مناسب انتخاب مشخصه از اهمیت ویژه ای در این حوزه برخوردار می باشد. در این راستا، در پژوهش انجام شده یک روش انتخاب مشخصه های توکار برای حل این چالش پیشنهاد شده است که نتایج بهتری را نسبت به روش های رایج می دهد. بهره گیری از روش های یادگیری با نظارت، که از مثال های آموزشی بر چسب دار استفاده می کنند، به عنوان یکی از رویکردهای سنتی جهت طبقه بندی متون مطرح است. برای انجام این نوع یادگیری با دقتی منطقی، وجود تعداد کافی از مثال های آموزشی برچسب دار ضروری است. بدین منظور به فردی خبره نیاز است که به هر سند برچسبی نسبت دهد؛ که این کار فرآیندی خسته کننده، زمانبر و پر هزینه می باشد. بنابراین تأمین تعداد کافی از مثال های آموزشی برچسب دار عملی غیر ممکن است. در مقابل، اسناد بدون برچسب اغلب در حجم زیاد قابل دسترس هستند. بنابراین، رویکرد موثر و عملی دیگر در یادگیری استفاده از اسناد برچسب دار به همراه اسناد بدون برچسب در زمان یادگیری می باشد، این ایده مبنای اصلی رویکرد یادگیری نیمه نظارتی را تشکیل می دهد. در این حالت، الگوریتم های یادگیری می توانند از داده های بدون برچسب استفاده کنند، که اغلب منتهی به تابع طبقه بندی دقیق تری می شود. در این پژوهش، روشی مبتنی بر یادگیری تجمیعی و رویکرد خودآموزی برای انجام یادگیری نیمه نظارتی پیشنهاد شده است که بر اساس آزمون های انجام شده موجب بهبود کارایی یادگیری نیمه نظارتی در زمینه ی طبقه بندی متون شده است.

۱۵ صفحه ی اول

رخدادکاوی در داده های ویدئویی با استفاده از روش های یادگیری نیمه نظارتی

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1390
مریم کوهزادی هیکویی محمد رضا کیوان پور

امروزه حجم زیادی از داده های ویدئویی در دسترس افراد است؛ داده های ویدئویی هم اکنون بیش از نیمی از ترافیک اینترنت را به خود اختصاص داده اند. سالانه 9000ساعت محصولات سینمایی و 8 میلیون ساعت محصولات تلویزیونی تولید می شود، این در حالی است که پیش بینی می شود تا سال 2014 بیش از 90% ظرفیت شبکه جهانی اینترنت به انتقال داده های ویدئویی اختصاص یابد. برای دسترسی کارا به این حجم عظیم داده، نیاز شدیدی به ابزارهای موثر و کار آمد برای جستجو و بازیابی محتوایی ویدئو احساس می شود. ویدئو کاوی مبتنی بر رخداد و و یدئو کاوی مبتنی بر ساختار، دو دیدگاه عمومی موجود در ویدئو کاوی به حساب می آیند. در دیدگاه مبتنی بر رخداد، هدف آشکارسازی رخدادهای مهم در داده های ویدئویی است که درک معنایی را از محتویات ویدئو افزایش می دهد. در حال حاضر کاوش رخدادها در داده-های ویدئویی از حوزه های تحقیقاتی فعالی است که در سالهای اخیر پیشرفت های قابل توجهی را به خود اختصاص داده است. توانایی تشخیص اشیاء متحرک و ردیابی آنها در یک دنباله ی ویدئو، اولین گام در تحلیل ویدئوهای نظارتی است. چالش اصلی موجود در تشخیص اشیاء متحرک و ردیابی، یافتن مدل پس زمینه ای دقیق برای تشخیص درست اشیاء پیش زمینه جهت ردیابی دقیق آنهاست که در عین حال از سرعت مناسبی هم برخوردار باشد، چنانچه این عملیات با کارایی مناسبی انجام نشود، کل فرایند رخدادکاوی را تحت تأثیر قرار می دهد. در این پژوهش، یک روش ردیابی سریع و دقیق برای حل این چالش پیشنهاد شده است؛ روش پیشنهادی بر روی دادگان pets2001و caviar مورد بررسی آزمون قرار گرفت و به ترتیب به میزان دقت 92.44 و 90.07 برای معیار f1 دست یافت. هنگامی که آشکارسازی رخدادها، به عنوان یک مسئله یادگیری بیان می شود، برای استفاده از روش های یادگیری نظارت شده، باید تعداد کافی از مثال های آموزشی برچسب دار فراهم شود. فراهم کردن تعداد کافی از مثال های آموزشی برچسب دار عملی بازدارنده است. در مقابل، ویدئوهای بدون برچسب به کمیت زیادی قابل دسترسی است. بنابراین، رویکرد موثر و عملی دیگر در یادگیری استفاده از نمونه های برچسب دار به همراه نمونه های بدون برچسب در زمان یادگیری است، این ایده مبنای اصلی رویکرد یادگیری نیمه نظارتی را تشکیل می دهد که اغلب منتهی به نتایج دقیقتری می شود. در این پژوهش، روشی مبتنی بر الگوریتم های تکاملی و روشی مبتنی بر یادگیری تجمیعی برای انجام یادگیری نیمه نظارتی پیشنهاد شده است که بر اساس آزمون های انجام شده موجب بهبود کارایی یادگیری نیمه نظارتی در زمینه ی تشخیص حرکات غیر عادی شده است. روش پیشنهادی بر روی دادگان glass، iris، pets2001، caviar با چهار معیار متفاوت مورد آزمون قرار گرفت که در مجموع کارایی روش های پیشنهادی را نشان میدهند.

۱۵ صفحه ی اول

یک روش مبتنی بر یادگیری نیمه نظارتی برای طبقه بندی داده های چند رابطه ای

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1393
محمد رضا کیوان پور

یکی از زمینه های کاربردی روش های یادگیری ماشین و تشخیص الگو در زمینه ی تجارت هوشمند برای سازمان ها می باشد. روش های تجارت هوشمند سازمان ها را قادر می سازد که تحلیل خردمندانه ای داشته باشند و تصمیم های به موقع و هوشمندانه اخذ کنند که تغییرات قابل ملاحظه ای در رقابت خود و شرایط بازار ایجاد کنند. بنابراین کاوش دانش روی داده های واقعی با استفاده از روش های یادگیری ماشین بسیار پرارزش می باشد. هرچند، قابلیت های روش های تشخیص الگو و یادگیری ماشین در مسیر اصلی تجارت هوشمند نتوانسته جایگاه اصلی خود را پیدا کند، مانع کلیدی برای این امر عدم سازگاری بین شکل های داده های ورودی برای اکثر روش های یادگیری ماشین و شکل های استفاده شده برای داده های سازمان-های واقعی می باشد. برای شرح دقیق تر علت عدم سازگاری می توان به این نکته اشاره کرد که بیشتر داده های جهان واقعی(سازمان ها) در چندین رابطه از پایگاه داده های رابطه ای موجود هستند. در همین راستا روش های داده کاوی چند رابطه ای مطرح شده اند که الگوهایی را که درگیر در چندین جدول از پایگاه داده های رابطه ای می باشند، را جستجو می کند. از جمله روش های مطرح شده در حوزه ی داده کاوی چند رابطه ای، روش های داده کاوی چند رابطه ای مبتنی بر یادگیری چند دیدی می باشند، اما این روش های پیشنهاد شده از اطلاعات همبستگی و مفید بین دیدها کاملا بهره نمی برند، پس نیاز به ارائه روشی می باشد که بتواند اطلاعات مفید بین دیدها را استخراج کند و در روند یادگیری از آن ها استفاده کند. همچنین، در کاوش پایگاه داده های رابطه ای، استفاده از روش های یادگیری نظارتی اغلب به دلیل هزینه-ی بالا برای برچسب زدن داده ها، کارآمد نیست. به همین دلیل در سال های اخیر علاقه مندی برای الگوریتم هایی که بتوانند هم از داده های برچسب دار و هم از داده های بدون برچسب برای کار پیش بینی استفاده کنند، افزایش یافته است. در این راستا، در این رساله سعی بر آن است که روش داده کاوی چند رابطه ای مبتنی بر یادگیری چند دیدی و یادگیری نیمه-نظارتی ارائه شود که بتواند از مزیت های هر دو رویکرد استفاده کند.

نام پژوهشگر: محمد رضا کیوان پور