نام پژوهشگر: سمیرا یگانه

تشخیص حالت‏های چهره
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه الزهراء - دانشکده فنی 1391
  سمیرا یگانه   رضا عزمی

با پیشرفت سریع سامانه‏های هوشمند و افزایش حضور رایانه‏ها در زندگی مدرن، تشخیص خودکار حرکات و حالت‏های غیر کلامی کاربر مورد توجه زیادی قرار گرفته است. هدف از انجام این پژوهش، توسعه یک سامانه تشخیص حالت چهره است که قادر به تشخیص حالت‏های احساسی پایه از روی تصاویر ساکن و از روی فریم‏های متوالی ‏باشد. یک سامانه آنالیز حالت چهره از سه بخش اصلی: آشکارسازی چهره، استخراج ویژگی چهره و تشخیص حالت چهره تشکیل می‏شود. در این پژوهش، محوریت با مرحله استخراج ویژگی بوده و برای بهبود روش‏های موجود، سه تلاش مجزا صورت می‏گیرد. در استخراج ویژگی‏های چهره، تاکید اصلی بر ترکیب کلی چهره و ویژگی‏های مبتنی بر ظاهر است. یکی از ویژگی‏های مبتنی بر ظاهر متداول، ویژگی‏های گابور است که استخراج آن نیازمند محاسبات سنگینی می‏باشد. برای کاهش محاسبات در مرحله استخراج ویژگی‏های گابور، روش rgfs برای انتخاب ناحیه‏ای فیلترهای گابور ارائه می‏شود. این روش نسبت به روش‏های پیشین که نگاهی سراسری به چهره دارند، از کارایی بالاتری برخوردار است. در تلاشی دیگر، برای تشخیص حالت چهره از روی تصاویری که بخشی از آن‏ها پوشیده شده، سه نوع ویژگی مبتنی بر ظاهر گابور، الگوهای دودویی محلی (lbp) و الگوهای دودویی گابور محلی (lgbp) مورد ارزیابی قرار می‏گیرند. نتایج حاصل از ارزیابی، دقت و مقاومت بالای روش lgbp را تحت شرایط متنوع پوشیدگی نشان می‏دهد. بطوریکه میانگین دقت تشخیص در شرایط پوشیدگی گوناگون بر روی تصاویر پایگاه داده ck+ با استفاده از ویژگی‏های گابور، lbp و lgbp به ترتیب برابر با 41/73%، 43/75% و 23/83% است و بر روی تصاویر پایگاه داده jaffe به ترتیب برابر با 49/78%، 85/84% و 22/90% است. البته این روش پیچیدگی محاسباتی بالایی دارد اما با استفاده از فیلترهای ناحیه‏ای انتخاب شده توسط روش rgfs، پیچیدگی محاسباتی آن نیز کاهش یافته و به روشی کارا جهت استخراج ویژگی از روی تصاویر پوشیده تبدیل می‏گردد. در تلاشی دیگر، برای استخراج ویژگی‏های حرکتی از روی رشته فریم‏های کلیدی حالت چهره، روش تعقیب حرکات چهره بر اساس شار نوری متراکم بکار گرفته شده است. یکی از ایرادهای سیستم‏های آنالیز قبلی این است که بردارهای حرکت حاصل از تعقیب پیکسل‏های تصویر را به صورت مستقیم مورد استفاده قرار می‏دهند، در صورتیکه می‏توان با ارائه توصیف سطح بالاتری از حرکت استخراج شده، اطلاعات شاخص‏تری را به عنوان ورودی در اختیار دسته‏بند قرار داد. بدین دلیل، در این پژوهش روش جدید الگوهای دودویی حرکت محلی (lmbp) برای استخراج الگوهای حرکتی از روی فریم‏های متوالی ارائه می‏گردد. در روش lmbp، اندازه و زاویه حرکت بر اساس تصاویر خاکستری بصری‏سازی شده و سپس از عملگر lbp برای استخراج الگوهای حرکتی از سطح این تصاویر استفاده می‏شود. نتایج حاصل از ارزیابی این روش بر روی رشته فریم‏های پایگاه داده ck+، کارایی این روش را بخوبی نشان می‏دهد. بطوریکه دقت تشخیص حالت چهره با استفاده از روش lmbp در مقایسه با روش gpt که در آن اندازه و زاویه حرکت حاصل از تعقیب یک شبکه از نقاط به عنوان ویژگی در نظر گرفته می‏شود و دقت آن 79/89% است، 37/4% افزایش می‏یابد.