رضا صفابخش

نام پژوهشگر: رضا صفابخش

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1385
احمد نیک آبادی رضا صفابخش

شبکه های عصبی پیمانه ای دسته خاصی از شبکه های عصبی هستند که به جای یک شبکه عصبی یکپارچه بزرگ از تعدادی شبکه عصبی کوچکتر تشکیل می شوند. این شبکه ها نسبت به شبکه های عصبی یکپارچه دارای مزایایی همچون کاهش پیچیدگی مدل، یادگیری سریعتر، مصونیت از تداخل مکانی و زمانی، قابلیت تفسیر بیشتر دانش کسب شده و شباهت بیشتر به شبکه های عصبی طبیعی هستند. از جمله انواع شبکه های پیمانه ای می توان به شبکه های حاصل از پیمانه ای کردن ورودی، پیمانه ای کردن خروجی و ترکیب سلسله مراتبی خبرگان اشاره کرد. در این شبکه ها با تقسیم یک کار بزرگ به تعدادی کار کوچکتر و انجام هر یک از این کارها توسط یک شبکه عصبی کوچک و سپس ترکیب راه حل های جزیی، راه حل نهایی مسأله به دست می آید.با توجه به مزایای فراوان شبکه های عصبی پیمانه ای نسبت به شبکه های عصبی یکپارچه، در این پروژه از دو نوع پیمانه ای کردن ورودی و خروجی برای طراحی شبکه های عصبی پیمانه ای جهت یادگیری دو بازی ox و اتلو استفاده شده است. در مورد بازی ox به دلیل سادگی مسأله از خروجی شبکه عصبی طراحی شده مستقیماً برای تعیین حرکت انتخابی استفاده می شود و در بازی اتلو از شبکه طراحی شده برای ارزیابی حالت های مختلف بازی در کنار الگوریتم جستجوی minimax استفاده می شود. در هر دو مورد شبکه های عصبی به شکل دلخواه و بر اساس تعریف مسأله طراحی می شوند. برای یادگیری وزن های شبکه های عصبی استفاده شده، پس از بررسی الگوریتم های تکاملی، از استراتژی تکامل نوع دوم استفاده شد. پس از طراحی شبکه های عصبی از الگوریتم هم تکاملی رقابتی برای یادگیری وزن های مناسب پیمانه های مختلف استفاده می شود. نتایج بدست آمده با دو شبکه عصبی یکپارچه متناظر مقایسه شده است. نتایج بدست آمده بیانگر آن است که با وجود اینکه تعداد پارامترهای آزاد شبکه های عصبی پیمانه ای کمتر از شبکه های عصبی یکپارچه نظیر است اما کارآیی این شبکه ها نسبت به شبکه های عصبی یکپارچه بیشتر است. همچنین در شبکه عصبی پیمانه ای می توان به راحتی از دانش موجود برای افزایش سرعت یادگیری استفاده کرد. دانش استخراج شده توسط این شبکه ها نیز قابلیت تفسیر و استفاده مجدد بیشتری دارد. در این پروژه همچنین چارچوب هم تکاملی رقابتی جدیدی پیشنهاد شده است. یکی از مشکلات مدل هم تکاملی رقابتی موجود، یادگیری نقش های متفاوت دخالت کننده در فرآیند تکامل در قالب یک فرد است. این امر سبب می شود، یادگیری سریع یکی از نقش ها باعث غلبه آن نقش بر نقش یا نقش های مقابل و عدم تکامل افراد جمعیت تکاملی شود. در چارچوب پیشنهادی به ازاء هر یک از نقش هایی که قرار است با استفاده از الگوریتم هم تکاملی یاد گرفته شود، جمعیت مجزایی در نظر گرفته می شود. در هر تولید نسل تعدادی از افراد هر جمعیت انتخاب و به مخزن فرد مربوطه افزوده می شوند. برای ارزیابی جمعیت های مختلف در کنار هر جمعیت تکامل یابنده جمعیت ارزیابی نیز تشکیل می شود. اعضای این جمعیت از افراد موجود در مخزن فرد انتخاب می شوند. سطح شایستگی افراد موجود در هر جمعیت ارزیاب بر اساس جمعیت رقیب افزایش داده می شود. به این ترتیب رشد سریع یک جمعیت نمی تواند مانع تکامل جمعیت ها شود. همچنین با حذف افراد ناکارآمد از جمعیت ارزیاب سرعت همگرایی الگوریتم به جواب بهینه نسبت به الگوریتم های متداول به مراتب افزایش می یابد. ارزیابی الگوریتم پیشنهادی در بازی های ox و اتلو نشان دهنده کارآیی بالای این الگوریتم است.

۱۵ صفحه ی اول

یادگیری تقویتی مبتنی بر نقشه خودسازمان ده تطبیقی با زمان

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1385
حسام منتظری رضا صفابخش

یادگیری تقویتی، نگاشت وضعیت ها به عمل ها با هدف ماکزیمم کردن سیگنال پاداش دریافتی را بررسی می کند. در این نوع یادگیری، به عامل گفته نمی شود که چه عملی را انتخاب کند، بلکه عامل باید عملی را انتخاب کند که پاداش دریافتی از محیط را بیشینه کند. در چالش برانگیزترین حالات، پاداش عمل ها بلافاصله مشخص نمی شود. یادگیری تقویتی، از یک سو دارای پشتوانه قوی از قضایا و اثبات های ریاضی است؛ و از سویی دیگر، این روش در مسایل مختلفی همچون مسیریابی ربات، اجتناب از مانع، تصمیم گیری در بازی ها، مسایل مهارت ها در روبوکاپ، و کنترل ترافیک به طور موفق عمل کرده است. یکی از مسایل مهمی که در مورد این روش مطرح می شود، بسط و توسعه روش به مسایلی با فضای وضعیت پیوسته است. برای حل مسایل با فضای وضعیت پیوسته، روش های مختلفی مانند شبکه های عصبی پرسپترونی چند لایه، کیمک، درخت های تصمیم، و نقشه های خود سازمان ده ارایه شده است. نشان داده شده است که یادگیری تقویتی با استفاده از نقشه های خود سازمان ده استاندارد در حل بسیاری از مسایل با فضای وضعیت پیوسته و حتی فضای عمل پیوسته موفق بوده اند. اما نقشه خودسازمان ده استاندارد نمی تواند یک تابع هدف متغیر را به خوبی ارایه کند و برای توابع هدفی که با توپولوژی نقشه همخوانی ندارد مورد استفاده واقع نمی شود. در این پایان نامه، یادگیری تقویتی مبتنی بر نقشه خودسازمان ده تطبیقی برای حل مشکل تابع هدف متغیر ارایه شده است. تابع هدف متغیر در یادگیری تقویتی منحصر به داده های فضای ورودی نیست، بلکه داده هایی که به عنوان ورودی نقشه خروجی داده می شود همیشه توزیع چگالی متغیر با زمان دارد. باید توجه داشت در یادگیری تقویتی عامل با گذشت زمان عملکرد خود را بهبود می دهد، در نتیجه داده های ورودی به نقشه خروجی با گذشت زمان تغییر می کنند و توزیع چگالی آن ناایستا است. روش دیگری که در این پایان نامه ارایه شده است روش یادگیری تقویتی با استفاده از نقشه خودسازمان ده رشدیابنده است. این روش برای حل هر دو مشکل ذکر شده ارایه شده است. ترکیب یادگیری تقویتی با نقشه های خودسازمان ده رشدیابنده به سادگی امکان-پذیر نیست و ترکیب این نوع نقشه با الگوریتم هایی که جدول کیو آن در طول زمان ثابت است، میسر نمی باشد. در این پایان نامه الگوریتم جدیدی مبتنی بر نقشه های خودسازمان ده رشد یابنده ارایه شده است که جدول کیو آن در طول زمان بزرگ و کوچک می شود. نشان داده شده است این الگوریتم در حل مسایل مختلف از بقیه روش ها موفق تر بوده است.

۱۵ صفحه ی اول

تشخیص بی درنگ حرکات دست در تعامل انسان با کامپیوتر

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386
ناصر نوراشرف الدین رضا صفابخش

در سالهای اخیر تحقیقات زیادی برای استفاده از ابزارها و روش های جدید برای ارتباط با کامپیوتر انجام شده است. در حال حاضر برای برقراری ارتباط با وسایلی مانند کامپیوتر، رباتها و یا سایر وسایل الکترونیکی نظیر تلویزیون از ابزارهای واسطی مانند موشواره و صفحه کلید، اهرمهای مکانیکی و الکتریکی و یا کنترلهای از راه دور استفاده می شود. با پیشرفت فناوری در آینده نزدیک شاهد خواهیم بود که انسانها بسیاری از کارهای روزمره خود را با استفاده از این وسایل انجام می دهند و بنابراین اگر بتوانند با این وسایل به همان شیوه ای که انسانها با یکدیگر تعامل دارند، ارتباط برقرار کنند، کارها بسیار راحت تر و بدون نیاز به ابزارهای واسط قابل انجام خواهد بود. در این پایان نامه یک الگوریتم مبتنی بر بینایی ماشین ارایه شده است که می تواند بصورت بی درنگ حرکتهای دست کاربران را تشخیص داده و معادل دستوری آنها را در کامپیوتر اجرا کند. در ابتدا با استفاده از روش تفاضل پس زمینه، تصویر کاربر از زمینه جدا و سپس با استفاده از یک مدل گاسی، پیکسلهایی که به رنگ پوست انسان هستند مشخص می شوند. از ویژگی های مهم الگوریتم پیشنهادی که برتری آن نسبت به سایر الگوریتم های ارایه شده نیز بشمار می رود، عدم نیاز به داشتن تصویر زمینه از قبل می باشد. در این روش الگوریتم خود از روی فریمهای اولیه تصویر زمینه را می سازد و در فریمهای بعدی آن را بروزرسانی می کند. در مرحله بعد با استفاده از عملگرهای ریخت شناسی نویزهای تصویر و ناحیه های آویزان دست حذف می شود. پس از تقطیع دستها، کف دست از بقیه قسمتهای آن مانند ساعد و بازوها جدا می شود. برای شناسایی دستها با استفاده از گشتاورهای مرکزی نرمال شده و گشتاورهای پیرامون، بردار ویژگی هر دست استخراج شده و این بردارهای ویژگی به عنوان ورودی به شبکه های lvq داده می شوند که این شبکه ها نوع حرکت کاربر را تشخیص می دهند. کلیه حرکتهای این سامانه ایستا بوده و کاربران حرکتها را با دو دست انجام می دهند. این الگوریتم می تواند 25 حرکت مختلف را که توسط پنج وضعیت پایه انجام می شود را با سرعت 5/2 فریم در ثانیه شناسایی کند. الگوریتم ارایه شده می تواند در حالت برون خط با دقت 6/97 و درحالت برخط با دقت 94 درصد حرکتهای کاربران را تشخیص دهد. در این الگوریتم مشکل همپوشانی صورت و دستهای کاربر حل شده و برای نور محیط هیچ نورپردازی خاصی در نظر گرفته نشده و سامانه می تواند در نورپردازی های مختلف کار کند.

۱۵ صفحه ی اول

بررسی خصوصیات همگرایی روش های ترکیبی یادگیری تقویتی با تخمین تابع

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386
بابک به ساز رضا صفابخش

برای بسیاری سیستم ها، توانایی یادگیری یک مزیت مهم و حتی در بعضی موارد یک نیاز است. از ابتدا، برای ایجاد توانایی یادگیری دو ایده کلی بسیار مورد توجه بوده است. ایده اول که به یادگیری با نظارت منجر می شود، استفاده از زوج های آموزشی ورودی-خروجی است. در این نوع یادگیری، سعی بر آموزش عملکرد درست به سیستم، با تعدادی مثال است که هر مثال شامل خروجی مورد انتظار از سیستم برای یک ورودی معین است. ایده دیگر که به یادگیری بی نظارت منجر می شود، استفاده از قاعده مندی های موجود در ورودی است. در این نوع یادگیری، هیچ راهنمایی ای از خارج سیستم وجود ندارد و سعی بر کشف الگوها و قاعده مندی هایی در ورودی است که برای تولید خروجی مطلوب سیستم، موثر هستند. از یک طرف، در یادگیری با نظارت تهیه زوجه های آموزشی ورودی -خروجی در بعضی مسایل سخت و حتی گاهی ناممکن است. از طرف دیگر، بدلیل عدم وجود راهنمایی تعلیمی کافی در یادگیری بی نظارت، این روش در بسیاری مسایل کارایی مطلوب ندارد. بدلیل این مشکلات، در دو دهه اخیر، توجه به یک ایده کلی جدیدتر به نام یادگیری تقویتی جلب شده است که از نظر میزان راهنمایی تعلیمی، بین یادگیری بی نظارت، این روش در بسیاری مسایل کارایی مطلوب ندارد. بدلیل این مشکلات، در دو دهه اخیر، توجه به یک ایده کلی جدیدتر به نام یادگیری تقویتی جلب شده است که از نظر میزان راهنمایی تعلیمی، بین یادگیری با نظارت و بی نظارت قرار می گیرد. در این نوع یادگیری، سعی بر آموزش عملکرد مطلوب به سیستم، با دادن یک معیار عددی از کارایی فعلی آن است. از یک سو، تهیه معیاری عددی از کارایی سیستم، بسیار آسان تر از تهیه زوجه های آموزشی ورودی-خروجی است و از سوی دیگر، میزان راهنمایی تعلیمی حاصل از این معیار عددی، می تواند برای راهنمایی سیستم به عملکرد مورد انتظار کافی باشد. در گذشته، بیشترین توجه در یادگیری تقویتی بر روش های مبتنی بر جدول متمرکز بوده است. در این روش ها، برای هر وضعیت (یا وضعیت-عمل) سیستم یک خانه از حافظه برای نگه داری ارزش عددی آن وضعیت (یا وضعیت-عمل) اختصاص می یابد. به همین دلیل، استفاده از یادگیری تقویتی مبتنی بر جدول، در مسایلی با فضای بزرگ که وضعیت ها (با وضعیت - عمل های ) بسیاری دارند، تقریبا ناممکن می باشد. از این رو، روشهایی برای بکارگیری یادگیری تقویتی در این مسایل، از جمله روش های مبتنی بر تخمین تابع، از خصوصیات همگرایی ضعیف تری نسبت به روش های مبتنی بر جدول برخوردارند که بررسی خصوصیات همگرایی آنها را برای استفاده درست از آنها پراهمیت می سازد. در این پایان نامهه در ابتدا، به بررسی سه روش مبتنی بر ارزش بر اساس تجمیع وضعیت سخت، شبکه پروسپرون چند لایه، و شبکه سی مک، و همچین دو روش مبتنی بر رویه ریاینفورس و بر خط باکستر و بارتلت پرداختیم. در آزمایشات تجربی این روش ها را بر روی سه مساله یادگیری تقویتی 100 راهزن مسلح، حفظ تعادل میله، و ربات ژیمناست، که به ترتیب درجه پیچیدگی آسان، متوسط و سخت دارند اجرا کردین. در این بررسی ها تاثیر پارامترهای مهم هر روش در خصوصیات همگرایی آنها مورد مطالعه قرار گرفت. این بررسی ها نشان دهنده خصوصیات همگرایی بهتر روش های مبتنی بر رویه، هم از لحاظ نظری بدلیل وجود تضمین های همگرایی قوی تر و هم از لحاظ تجربی بدلیل نتایج بهتر بود. همچنین یک سیستم نیورو-فازی جدید بر اساس روش های مبتنی بر رویه، طراحی کردیم. معماری این سیستم جدید با ایجاد تغییراتی در معماری یک سیستم موجود که آن را برای مساله های یادگیری تقویتی اپیزودی مناسب می سازد، بدست آمده است. علاوه بر این، همگرایی الگوریتم یادگیری آن را به یک ماکزیمم محلی امیدریاضی میانگین پاداش اثبات کردیم. این سیستم نیورو-فازی، در حالیکه تمامی فواید معمول سیستم های نیورو-فازی را دارد، داری این خصوصیت اضافه است که در چارچوب تقویتی عمل می کند و برای آموزش آن به جای زوج های آموزشی ورودی-خروجی تنهابه یک سیگنال تقویتی نیاز است. در نهایت، مقایسه نتایج این سیستم جدید با پنج روش قبلی نشان دهنده برتری واضح کلی آن( بادر نظر گرفتن نتیجه سه مساله با هم) بر آنها بود. در مساله 100 راهزن مسلح، تمامی روش ها قابل مقایسه با هم بودند و به عملکرد مطلوب رسیدند. در مساله حفظ تعادل میله، سیستم جدید بهترین عملکرد و در مساله ربات ژیمناست، با اختلافی ناجیز دومین بهترین عملکرد را داشت . این نتایج در حالی بدست آمده است که از دانش قبلی در روش نیورو-فازی استفاده نشده است.

۱۵ صفحه ی اول

شبیه سازی و ارائه روش جدید زمانبندی چراغ های هوشمند ترافیکی با استفاده از سیستم های چندعاملی از طریق اتوماتای یادگیر

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1386
لعبت عزیزی رضا صفابخش

سیستم کنترل ترافیک هوشمند تطابقی، سیستمی است که در آن کنترل وسایل نقلیه در سطح شهر یا دامنه ی کاری مربوطه، توسط سیستم های رایانه ای که دارای درجه ای از هوشمندی می باشند انجام می شود و اغلب این سیستم ها دارای توانایی یادگیری از شرایط گذشته و قدرت مدل کردن وضعیت های آتی و همچنین کنترل بحران می باشند. سیستم های کنترل ترافیک متداول، بیشتر مجموعه ای از وضعیت های ذخیره شده ی قبلی همراه با عمل مناسب برای هر وضعیت بوده و به عبارت دیگر، دارای مشکل تطابقی یا موثر بودن اجرا هستند، در حالی که بسیاری از این سیستم ها نیاز به ذخیره ی موقعیت هایی دارند که پوشاننده ی شرایط خاص یا تمام شرایط ترافیکی باشد. برای این منظور، باید یک سیستم کنترلی ترافیک تطابقی وجود داشته باشد که قادر به یادگیری تدریجی تمام شرایط ترافیکی و همچنی مدیریت شرایط خاص باشد. چنین سیستمی برای موثر بودن اجرا باید از واحدهای کنترل کننده ی ترافیکی توزیع شده، که به شکل محلی ترافیک را کنترل کرده و هر یک شرایط محلی محیط خود را یادگرفته و تعامل مناسب و محدود با همسایگان مجاور خود داشته باشند، پیاده سازی شود. سیستم های کنترل ترافیک هوشمند مرسوم نیز، با داشتن مزیت توانایی یادگیری از شرایط گذشته و عدم نیاز به ذخیره ی وضعیت های ترافیکی گوناگون همچنان مشکل خارج خط بودن یادگیری را دارند. با این وصف، سیستم مورد نظر باید قادر به یادگیری و اجرای همزمان کنترل ترافیکی به منظور کنترل موثر جریان ترافیکی باشد. تاکنون روش ها و تکنولوژی های متعددی برای طراحی یک سیستم کنترل ترافیک موثر ارائه شده است که هر یک دارای ضعف ها یا قوت هایی است. در این پایان نامه روشی برای طراحی و پیاده سازی کنترل موثر ترافیک شهری ارائه می شود که بر اساس آزمایشات انجام گرفته از روش کنترل ترافیک با چراغ های راهنمایی چرخه ثابت دارای کارایی بیشتری است . این روش بر پایه ی طراحی واحدهای تصمیم گیرنده ی کنترل ترافیک با تکنولوژی سیستم چند عاملی می باشد که در این سیستم، عامل ها عمل تصمیم گیری خود را با استفاده از تکنولوژی اتوماتاهای یادگیر انجام می دهند. این سیستم در حقیقت اجرایی جدید از سیستم های پیشین مشابه با تلفیق این دو تکنولوژی محاسباتی و پرارزش است. برای انجام این پایان نامه، طراحی و پیاده سازی محیط شبیه سازی مناسب این سیستم انجام و روش ارائه شده در این شبیه ساز اجرا گردیده است. روش ارائه شده ، برای بدست آوردن مناسب ترین نتیجه ی اجرا با سه مدل خطی موجود در اتوماتاهای یادگیر و بر اساس سه پارامتر ارزیابی "متوسط زمان انتظار ماشین ها" ، "انحراف معیار زمان پاسخگویی " و "توان عملیاتی" مورد مقایسه قرار گرفته است. آزمایشات نشان داده که بکارگیری مدل خطی پاداش جریمه جزئی اتوماتای یادگیر، در این سیستم کنترل ترافیکی، موثرتر از دیگر مدل های خطی اتوماتاهای یادگیر است. محیط شبیه ساز سیستم کنترل ترافیکی طراحی شده برای این پایان نامه، قابلیت بکارگیری در آزمایشات دیگری غیر از این پایان نامه را دارد و می توان در سایر کارهای تحقیقاتی مرتبط با زمانبندی های چراغهای راهنمایی در سیستم های کنترل ترافیکی نیز مورد بهره برداری قرار گیرد.

۱۵ صفحه ی اول

تعیین هویت افراد بر اساس مدل الگوی حرکتی بدن در هنگام راه رفتن

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1387
فائزه تفضلی رضا صفابخش

بینائی یکی از با اهمیت ترین حس های بشر در درک محیط اطرافش می باشد، با این حال سیستم های کامپیوتری همچنان در این زمینه بسیار محدود می باشند. تعداد کاربردهای عملی برای سیستم های کامپیوتری ای با قابلیت بصری بسیار زیاد است. این پروژه بر مساله ردیابی حرکات انسان و به خصوص راه رفتن متمرکز می باشد. عبارت "تعیین هویت بر اساس الگوی حرکتی بدن به هنگام راه رفتن" برای شناسایی افراد در توالی هایی از تصاویر بر مبنای نوع راه رفتن شان استفاده می شود. این ویژگی توسط خصوصیات فیزیکی و حرکتی هر فرد تعریف شده و از آنجائی که بر اساس تحقیقات پزشکی و روانشناسی، برای هر فرد منحصر به فرد بوده و قابل استفاده در فواصل نسبتا دور نیز می باشد، بیومتریک مناسبی بخصوص هر کاربردهای امنیتی بشمار می رود. در این پروژه رویکرد مبتنی بر مدلی برای تعیین هویت افراد در حال راه رفتن از تصاویر ویدیوئی ارائه شده است. از این رو، دو راهبرد، مدل سازی محلی وعمومی بکار رفته ، و برای این منظور از دانش اولیه ای در رابطه با شکل بدن انسان و حرکات وی برای هدایت فرایند استخراج استفاده شده است. از اطلاعات شکلی و حرکتی استخراج شده برای بازسازی شناسه های الگوی حرکتی بدن، به منظور شناسائی و تعیین هویت فرد استفاده می شود. دراین میان سعی در ارائه راهبردی در تعیین دقیق تر میزان چرخش مفاصل در طول راه رفتن بوده است. حرکت مفاصل علاوه بر آنکه عاملی در تشخیص دقیق تر می باشند، بر پیچیدگی حرکات شخص هدف افزوده و احتمال رخداد همپوشانی (پوشیده یا نامشخص شدن یک بخش از بدن توسط بخش دیگر) را افزایش می دهند. همچنین علاوه بر پارامترهای پویای مربوط به ویژگی های حرکتی فرد، مانند الگوی چرخش پاها، تاثیر زوایای نوسان دست ها نیز بر روند شناسائی مورد بررسی قرار گرفته اند.

۱۵ صفحه ی اول

مدل سازی، تشخیص و تعقیب حرکات چشم انسان در دنباله تصاویر

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1383
محمدحسین خسروی رضا صفابخش

تشخیص چهره و اجزای تشکیل دهنده آن یکی از مهمترین رویکردهای تسهیل کننده ارتباط میان انسان و ماشین و حیطه ای فعال در حوزه علم بینایی ماشین است. از جمله کاربردهای این رویکرد می توان به طراحی و ساخت رابط های نرم افزاری هوشمند، کنترل امنیتی اماکن، تشخیص حالات چهره انسان برای کنترل شرایط بحرانی مانند خواب آلودگی راننده و مانند اینها اشاره کرد. در این میان چشم ها و اجزای شان از اهمیت خاصی برخوردارند. هدف این پایان نامه بررسی و مطالعه روش های موجود و ارایه روشی جدید برای مدل سازی، تشخیص و تعقیب حرکات چشم در یک دنباله از تصاویر است. تشخیص چشم ها در تصویر اوّلین مرحله ای ست که مورد بررسی قرار می گیرد. هدف از این مرحله مکان یابی و استخراج نواحی دارای چشم از بقیه اجزای صورت و تصاویر زمینه است. برای این منظور سه روش متفاوت، بسته به کیفیت تصویربرداری ارائه شده است. روش عمومی، تقطیع و انتخاب بزرگترین ناحیه مشمول رنگ پوست درون تصویر بمنظور مشخص نمودن ناحیه چهره است. پس از مشخص شدن ناحیه چهره نوبت به جداسازی نوار چشمی یا همان مستطیل دربردارنده هر دو چشم می رسد. در روش اوّل نمای عمودی که مستلزم نرمال سازی ناحیه چهره و عمود قراردادن محور اصلی بهترین بیضی برازش شده در آن است، وظیفه جداسازی این نوار را بر عهده دارد. علاوه بر این روش، دو متد دیگر مبتنی بر بکارگیری فیلتر بالاترین اختلاف سطح تباین و دیگری بر اساس استفاده از عملگرهای مورفولوژیک برای تصاویری که از سطح تباین مناسبی برخوردارند، پیشنهاد شده اند. پس از جداسازی نوار چشمی، متد تطبیق کلیشه بسادگی دایره عنبیه را در هر چشم مشخص می کند. گوشه های هر چشم نیز با استفاده از ردگیری کانتور پلک فوقانی قابل دسترس اند. به این ترتیب موقعیت اجزای اصلی چشم مشخص شده اند. در این پایان نامه برای مدل کردن حرکات چشم و میزان باز یا بسته بودن آن از اطلاعات ارائه شده توسط لبه های داخلی چشم استفاده شده است. دو متد اصلی نیز برای استخراج این لبه ها پیشنهاد و پیاده سازی گردیدند. منحنی های فرم پذیر(snake) و نگاشت خود سازمانده تطبیقی (tasom). هر یک از این دو متد با شروع از یک منحنی تخمینی اوّلیه و بسط تکراری این منحنی سعی در بدست آوردن شکل و فرم لبه های داخلی چشم می کنند. بمنظور ایجاد تخمین خوبی از منحنی اوّلیه، نقاط خاصی درون چشم تعریف و استخراج و دوایری با شعاع مناسب بمرکز این نقاط بعنوان منحنی های اوّلیه اختیار گردیدند. منحنی های فرم پذیر برای بسط منحنی اولیه و برازش آن بر لبه های داخلی چشم از کمینه سازی یک تابع انرژی بهره می برند. جملات این تابع انرژی در بردارنده محدودیت های شکل و فرم خود منحنی(انرژی داخلی) و محدودیت های تحمیل شده از جانب تصویر(انرژی خارجی) هستند. تنوّع منحنی های فرم پذیر نیز در تنوّع انواع انرژی خارجی تعریف شده برای آنهاست. در این مطالعه از منحنی های فرم پذیر gvf برای استخراج لبه های داخلی چشم استفاده گردید. علاوه بر منحنی های فرم پذیر، نگاشت خودسازمانده تطبیقی نیز برای این منظور بکار گرفته شده است. این نگاشت که نسخه ای تکامل یافته از نگاشت خودسازمانده تطبیقی کوهونن است بر آنست که تغییرات محیطی را نیز دنبال نماید و بتواند در محیطی پویا قابل استفاده باشد. بسط منحنی اوّلیه تخمین زننده لبه های چشم در این روش مبتنی بر یادگیری از بردارهای ویژگی خاصی که اغلب نقاط لبه ای تصویر هستند صورت می گیرد. منحنی های استخراج شده توسط هر یک از دو روش فوق می توانند بعنوان مدلی برای چشم مورد استفاده قرار بگیرند. چرا که امکان بازسازی شکل و فرم چشم با داشتن این منحنی ها در جایی دیگر امکان پذیر است. در عین حال مدل جدید دیگری نیز برای توصیف شکل چشم مبتنی بر محور میانه پیشنهاد گردیده است. پس از تشخیص و شناسایی چشم، نوبت به تعقیب حرکات آن در دنباله تصاویر می رسد. مبتنی بر دستاوردهای مرحله تشخیص حاصل از بکارگیری دو متد گفته شده، روشی برای تعقیب حرکات چشم با نام مدیریت تغییرات ارائه گردید. در این روش تصمیم گیری برای چگونگی پیشروی فرآیند تعقیب با در نظر گرفتن مقدار تغییرات بین فریمی و تغییرات همسایگی های گره های منحنی تخمین زننده لبه های داخلی چشم در دو فریم متوالی صورت می پذیرد. گره هایی از منحنی تخمین زننده که در فریم جاری تخمین خوبی از نقاط لبه ای چشم نیستند جای خود را به گره های جدیدی می دهند که طی پروسه تخمین لبه، موقعیت مناسب خود برای توصیف لبه های چشم را بدست می آورند. اگر سطح تغییرات بدست آمده دو فریم از حدّ آستانه ای بیشتر بود، الگوریتم با تعویض حالت به حالت تشخیص مجدداً کار مکان یابی عنبیه و به تبع آن نقاط مهّم چشمی را انجام خواهد داد. البته این کار فقط در ناحیه مشخصی صورت خواهد پذیرفت.

۱۵ صفحه ی اول

ردیابی افراد با چند دوربین

پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر 1385
محمد ایزدی رضا صفابخش

در سالهای اخیر نظارت ویدئویی یکی از موضوعات فعال تحقیقاتی در زمینه بینایی ماشین است, به طوری که طیف وسیعی از کاربردها شامل کنترل فضاهای خاص, آمارگیری از مکانهای شلوغ و تحلیل ازدحام, تشخیص رفتارهای غیر عادی, نظارت بر فضای وسیع با چند دوربین و غیره را در برگرفته است. با توجه به این مطلب سیستمی جدید جهت ردیابی افراد در فضاهای باز و بسته با استفاده از چند دوربین ارائه و پیاده سازی شده است. این سیستم از چهار قسمت تشکیل شده است: تقطیع حرکت, ردیابی افراد, مدیریت همپوشانی افراد و ترکیب داده های دوربینها. پس از دریافت تصویر صحنه از هر دوربین تقطیع حرکت انجام می گیرد. برای این منظور روشی جدید جهت مدل کردن زمینه و جدا سازی افراد از زمینه ارائه شده است که حساسیت آن نسبت به تغییرات نور و نویز محیط کم می باشد و سایه های افراد را نیز حذف می کند. با استخراج افراد از زمینه برای هر دوربین, عمل ردیابی انجام می گیرد. در این سیستم از ردیابی مبتنی بر کانتور فعال استفاده شده است. برای ردیابی افراد دو روش جدید, یکی ردیابی با استفاده از مدل کانتور فعال مبتنی بر شاخه و قید با کنترل فازی و دیگر ردیابی با نسخه جدیدی از مدل کانتور فعال مبتنی بر نگاشت خود سازمانده تطبیقی با زمان بکار گرفته شده است. هر دو روش به طوری که در بررسی ها و آزمایشات نشان داده شده, نسبت به روشهای مشابه قبلی بسیار سریعتر و دقیقتر عمل می کنند. با استفاده از ردیابی با مدل کانتور فعال به خوبی مشکل همپوشانی افراد توسط یکدیگر حل شده است. با نزدیک شدن افراد به یکدیگر گروه تشکیل شده و این گروه ردیابی می شود و با جدا شدن افراد از هم نیز افراد به صورت قبل از تشکیل گروه از هم تشخیص داده می شوند. با استفاده از سه قسمت بیان شده, به ردیابی افراد واقع در میدان دید هر دوربین پرداخته می شود. قسمت ترکیب داده های دوربینها نیز جهت ردیابی افراد در کل فضای تحت پوشش دوربینها به کار گرفته می شود. با استفاده از این قسمت, انتقال افراد از میدان دید دوربینی به دوربین دیگر تشخیص داده می شود و اطلاعات افراد به دوربین دیگر منتقل می شود. همچنین این قسمت, موقعیت فرد در هر نقطه از فضای تحت پوشش دوربینها را به کاربر نمایش می دهد. سرعت, دقت و کارآیی هر قسمت پروژه در آزمایشات عملی با کارهای دیگر مقایسه و برتری آنها نشان داده شده است. سیستم پیشنهادی در مواردی که ازدحام افراد زیاد نباشد, خوب عمل کرده و از سرعت و دقت خوبی نسبت به کارهای مشابه برخوردار است.

۱۵ صفحه ی اول

طراحی و ساخت قسمت ورودی - خروجی یک سیستم پردازش تصویر بلاد

پایان نامه 0 1370
شهردار انوشیروان رضا صفابخش

این گزارش طراحی و پیاده سازی یک رقمی کننده ویدیو بلادرنگ که کیفیت تصوی با کیفیت تصاویر تلویزیونی برابری می کند را مورد بحث قرار می دهد. مدار مذکور در یکی ازشکافهای داخلی کامپیوتر شخصی at نصب شده اصطلاحات تصویری حاصل از آن مستقیما از حافظه کامپیوتر خوانده می شود. همچنین از روی تصویر رقمی یک سیگنال ویدئو ساخته می شود، تا تصویر رقمی شده قابل نمایش بر روی یک مانیتور باشد . نرم افزار لازم جهت کنترل سخت افزار، ارتباط با کاربر و افزودن گرافیک بر روی تصاویر، نوشته شده تا دستگاه بتواند به نحو مطلوب و امکانات متنوع مورداستفاد قرار گیرد . مشخصات سیستم حاصل بشرح زیر است : تعداد تصویر رقمی شده در ثانیه 25 عدد رزلوشن مکانی 512x512 تعداد سطوح خاکستری 256 عدد تعداد کانال ورودی 4 عدد تولید سیگنال ویدئو از روی تصاویر رقمی نمایش بلادرنگ تصویر ورودی امکان نگهداری دو تصویر جداگانه در حافظه امکان افزایش تصویر گرافیکی بر روی تصویر امکان انتخاب نقاط تصویر بکمک مکان نما قابلیت نصب بر روی شیار داخلی کامپیوتر وجود دو دروازه رقمی برای اتصال به بوردهای بعدی وجود یک مجموعه نرم افزار طبقه بندی شده وجود یک سیستم منیو برای استفاده ساده وجود توابع گرافیکی آماده برای رسم نقطه، خط، مستطیل و دایره امکان چاپ تصاویر و بهبود کیفیت آنها پیش از چاپ

طراحی و ساخت قسمت ورودی - خروجی یک سیس

پایان نامه 0 1368
انوشیروان شهردار رضا صفابخش

تصویر پردازی زنده می تواند در خود کار کردن بسیاری از فرآیندها بسیار موثر و مفید واقع شود . برای انجام تصویرپردازی زنده بایستی بتوان تصاویر را با سرعت بسیار زیاد رقمی کرد . این پروژه با تعریف یک معماری انعطاف پذیر برای یک سیستم تصویرپردازی تک رنگی زنده برای با کاربا کامپیوترهای سازگار با کامپیوترibm - at مدول ورودی - خروجی آن را طراحی کرده یک نمونه آزمایشگاهی و یک نمون مدار آن را می سازد . مشخصات کلی مدول بقرار زیر هستند . رزولوشن 512، 512، 256 سطح خاکستری - رقمی کردن تصویر بصورت زنده - امکان انتخاب یکی از چهار منبع ورودی از طریق نرم افزار - امکان کنترل بهره و سطح سیگنال ورودی از طریق نرم افزار - جداول ورودی و خروجی برای انجام تبدیلات نقطه ای - امکان اضافه نمودن اطلاعات گرافیکی بر روی تصویر - امکان تولید سیگنا ساعت و یا پذیرفتن آن ازخارج و انتخاب یکی بکمک نرم افزار - سه سیگنال ویدئو خروجی برای کانالهای سرخ، سبز و آبی .