نام پژوهشگر: مرجان ممتازپور

بررسی و بهبود روش های رده بندی در تصاویر ویدئویی به منظور تشخیص مفاهیم معنایی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1389
  مرجان ممتازپور   محمد حسین سرایی

با رشد روزافزون داده ها (از قبیل متن، صوت و تصویر) نیاز به نمایه گذاری، جستجو، سازمان دهی و دسته بندی خودکار داده ها افزایش یافته است. بیشتر این داده ها، داده های چندرسانه ای، شامل صوت و تصویر هستند. یکی از مهمترین مسائل در سال های اخیر، تشخیص مفاهیم معنایی است. هدف اصلی در تشخیص مفاهیم معنایی تعیین حضور مفهوم معنایی خاصی مانند «خارج ساختمان»، « هواپیما»، »خودرو» و «انسان» در قاب های ویدئویی است. در گذشته، پیشرفت هایی در تشخیص مفاهیم معنایی در دامنه های مختلف گزارش شده است. رده بندی یکی از روش های متداول در حوزه تشخیص مفاهیم معنایی است. در حالیکه بسیاری از رده بندها می توانند برای این منظور استفاده شوند، svm متداول ترین آنهاست. رده بند های svm در مسائل رده بندی پیچیده خوب عمل می کنند. با اینحال، فاز یادگیری آنها مخصوصاً در مواردی که تعداد خصیصه ها زیاد است، فرآیندی زمان بر محسوب می شود. هر خصیصه اضافی، هزینه، حافظه مورد نیاز و زمان سیستم رده بندی را افزایش میدهد. به همین دلیل، محققان پردازش تصویر، تمایل دارند تا برای طراحی و پیاده سازی رده بندها از مجموعه خصیصه های کوچک استفاده کنند. با اینحال، به مجموعه ای مناسب از خصیصه ها برای بدست آوردن نرخ بازشناسی قابل قبول نیاز است. بنابراین، جستجو برای یافتن زیرمجموعه ای بهینه از خصیصه ها از میان مجموعه خصیصه های موجود، دارای اهمیت ویژه ای است. در تشخیص مفاهیم معنایی از طریق رویکردهای یادگیری ماشین، تعداد زیادی از خصیصه ها در کارهای گذشتگان در نظر گرفته می شد. اما، رده بندی بر اساس این تعداد زیاد از خصیصه ها نه تنها زمان رده بندی را افزایش می دهد بلکه می تواند باعث کاهش کارایی سیستم رده بند گردد. بنابراین، انتخاب خصیصه می تواند به عنوان راه حلی مناسب برای کم کردن تعداد خصیصه ها باشد. هدف این پایان نامه، بهبود رفتار رده بند از دیدگاه زمان و کارایی است. در این پایان نامه، قالب کاری جدیدی برای انتخاب مهمترین خصیصه ها از میان خصیصه های سطح پایین، که در رده بند های موجود استفاده می شوند، ارائه می گردد. این کار منجر به کاهش زمان یادگیری و رده بندی توسط خصیصه های انتخاب شده میشود. علاوه بر بهبود زمان رده بند، کارایی رده بند نیز قابل قبول خواهد بود. بدین منظور از الگوریتم ژنتیک برای انتخاب خصیصه استفاده می شود. بعد از انتخاب خصیصه، رده بندهای پایه برای تشخیص وجود مفاهیم معنایی در ویدئو آموزش داده می شوند. به علاوه، از ترکیب برای بهبود کارایی رده بندهای پایه استفاده می شود. در مرحله ترکیب، از خصیصه های انتخاب شده (توسط روش ارائه شده) استفاده می شود و با روش های ترکیب پیشین مقایسه می گردد. نتایج شبیه سازی ها نشان می دهند که با پالایش خصیصه های نا مربوط، معیارهای ارزیابی کارایی رده بند مخصوصا میانگین ظرافت (ap) بهبود می یابند. ظرافت، فراخوانی، دقت، f-score و ویژگی معیارهای کارایی دیگری هستند که در شبیه سازی ها اندازه گیری شده اند.