نام پژوهشگر: محمد ترقی خواه

بررسی و بهبود الگوریتم ردیابی تصویری تنک مبنا در مواجهه با انسداد جزئی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر 1393
  محمد ترقی خواه   رسول امیرفتاحی

ردیابی اشیاء متحرک یکی از مسائل مطرح در حوزه بینایی ماشین است که به دلیل کاربردها و چالش های فراوان، هنوز هم با گذشت بیش از سه دهه، توجه محققان را به خود جلب نموده است. اگر چه سابقه طرح موضوع ردیابی به مسائل نظامی بر می گردد، ولی امروزه در حوزه های صنعتی و تجاری به منظور تحلیل حرکت، تشخیص فعالیت، نظارت و مراقبت، تعامل انسان با رایانه و غیره دارای کاربرد بسیار گسترده است. ردیابی را می توان نمایش تغییرات حالت یک شیء و دنبال کردن آن تغییرات در قاب های متوالی ویدئو تعریف کرد. ردیابی در محیط های بدون محدودیت به دلیل تغییرات منظر شیء هدف ناشی از فاکتورهای ذاتی ( همچون تغییر موقعیت و شکل شیء) و یا بیرونی ( از قبیل تغییر روشنایی و نورپردازی محیطی، حرکت دوربین و مات شدگی صحنه، وجود هدف نما، اختلالات نویزی و انسداد) مسئله ای چالش برانگیز است. از این میان، در اکثر دنباله تصاویر ویدئویی، بخشی از شیء هدف در قاب های مختلف قابل مشاهده نیست؛ چنین پدیده ای به انسداد جزئی موسوم بوده و به عنوان یکی از موضوعات کلیدی در بسیاری از تلاش های تحقیقاتی ردیابی در طی سال های اخیر مطرح بوده است. هدف این پژوهش، دستیابی به یک الگوریتم ردیابی است که علاوه بر مقاوم بودن در برابر انسداد جزئی، حتی الامکان در برابر سایر چالش های ردیابی نیز عملکرد خوبی داشته باشد و همچنین از نظر زمانی، به حالت بلادرنگ نزدیک شود. برای این منظور ردیاب مبتنی بر نمایش تنک دومرحله ای زبر و نرم را ارائه می دهیم که در آن ابتدا منظر شیء هدف با واژه نامه ای متشکل از بردارهای پایه pca و قالب های جزئی مدل می شود و برای این مدل سازی از روش حل apg_l1بهره می بریم. برای افزایش سرعت محاسبات، در مرحله اول به کمک بلوک بندی مربعی و درشت روی قالب های جزئی، تعداد قالب های جزئی واژه نامه را کاهش می دهیم و آنگاه در مرحله بعد، برای پیدا کردن انسداد در سطح پیکسل، کاندیداهای برتر بدست آمده از مرحله قبل را با روش pca_l1 مورد ارزیابی قرار داده تا کاندیدای نهایی بدست آید. کارایی ردیاب پیشنهادی روی دنباله تصاویر مرجعocclusion1, occlusion2, caviar2, car4, singer1, david indoor, car11, david outdoor, face, deer, sylvester2008b, jumping و با معیارهای ارزیابی مرسوم توسط یک کامپیوتر ghz 5/2 core i5 با حافظه gb 4 و تحت نرم افزار matlab 2013a مورد بررسی قرار گرفته است. نتایج شبیه سازی نشان می دهند که ردیاب علاوه برداشتن مقاومت خوب در برابر انسداد جزئی و برخی چالش های دیگر، به لحاظ زمانی نیز بهبود قابل ملاحظه ای داشته است. بر اساس این نتایج، می توان گفت که ردیاب پیشنهادی در مجموع نسبت به سایر روش ها دارای عملکرد بهتری هم در زمینه دقت و هم سرعت می باشد؛ نتایج کمی مقایسه با پنج الگوریتم ردیابی غیر تنک و نیز هفت الگوریتم کارآمد و مرسوم تنک مبنا بر روی دوازده دنباله تصویر نشان می دهد که ردیاب پیشنهادی با سرعت اجرای 2/14 قاب بر ثانیه، منجر به میانگین خطای مرکزیابی 2/10 پیکسل و میانگین درصد هم پوشانی 7475/. می شود در حالی که نزدیکترین الگوریتم رقیب، تنها با سرعتی حدود 7/2 قاب بر ثانیه، منجر به میانگین خطای مرکزیابی 9/12 پیکسل و میانگین درصد هم پوشانی 7458/. می شود که این نتایج گویای برتری روش پیشنهادی هستند