طراحی و اجرای کنترل توجه در یک سیستم رانندگی بر اساس پیش بینی مشاهده

پایان نامه
چکیده

در این پژوهش هدف، مدلسازی توجه و به کارگیری آن در یادگیری حرکت یک ربات در یک مسیر مشخص می باشد که این رویکرد نهایتا منجر به متغیر شدن زمان نمونه برداری خواهد شد. از میان بستر های گوناگون، ایده کنترل توجه یک عامل هوشمند برگزیده شده است که در قالب یک مسئله یادگیری تقویتی در فضای پیوسته با به کارگیری الگوریتم یادگیری بیزی مطرح می شود. چالش اصلی عامل در طی این یادگیری تصمیم سازی بهینه با در نظر گرفتن محدودیت های زمانی و پردازشی از نقطه نظر دسترسی به منابع سنسوری و به روز رسانی فضای ادراکی جهت در اختیار داشتن درک بهتر از جهان پیرامون، می باشد. بنابراین برای ارضا نمودن محدودیت های موجود از یک سو و رسیدن به یک درک صحیح از موقعیت جهان از سوی دیگر تخمین فضای ادراکی به گونه ای هوشمندانه به کار گرفته شده است، تا عامل بر مبنای نیازها و محدودیت هایش بیاموزد در چه زمانی و چگونه از منابع سنسوری اش بهره بگیرد و چه زمانی با به کارگیری قابلیت های محاسباتی اش از طریق تخمین فضای ادراکی، به شناخت کافی از جهان پیرامون دست یابد. در این پژوهش حالت ها داده های قبلی خود را از دست نمی دهند و تصمیم گیری عامل براساس اطلاعاتی که از قبل پیش بینی شده است، انجام می گیرد. بنابراین باید حالت های گذشته و اثر آن ها برای تصمیم گیری عامل در لحظه ی کنونی نگهداری شوند. هم چنین به دلیل داشتن تعداد محدودی منبع برای گرفتن داده از محیط و هزینه بهره برداری از آن ها عامل در هر لحظه فقط می تواند توجه خود را به یک زیر مجموعه از منابع یا تصمیم گیر های محلی معطوف کند. در نتیجه تغییر جهت توجه باید به صورت بهینه انجام شود، هم چنین زمانی را که عامل برای گرفتن داده از یک منبع دانش سپری می کند ممکن است با سایر منابع برابر نباشد به عبارت دیگر عامل بر حسب نیاز ممکن است نمونه های داده بیشتری را از یک منبع دریافت کند که این امر منجر به متغیر بودن زمان نمونه برداری می شود. برای رسیدن به این اهداف از یک ماشین پیش بین استفاده شده است که در هر بار نمونه گیری ، حالت های بعدی هم پیش بینی می کند. در نتیجه هنگام توجه به یک منبع، عامل عکس العمل مناسب را بر اساس داده های فعلی و همچنین حالت های پیش بینی و نگهداری شده در نمونه گیری های قبلی انجام می دهد. این عکس العمل مناسب شامل تعیین مکان بعدی توجه نیز می شود. یعنی عامل باتوجه به داده های کنونی و داده های ذخیره شده در حافظه اش بهترین جهت برای تغییر مکان توجه و هم چنین بهترین فعل کنشی برای اثر گذاری روی محیط پیرامونش را انجام می دهد. برای تحقق این هدف تخمین پویا و غیر پویای فضای حالت در چارچوب یادگیری وظیفه پیشنهاد شده است. این چارچوب روی روبات e-puck در محیط شبیه سازی رباتیکی وبات آزموده شده است. نتایج شبیه سازی نشان می دهد که روبات می آموزد، چگونه با پرداخت هزینه کمتر که از طریق به کارگیری تخمین فضای حالت به جای به روز رسانی داده های سنسوری حاصل می شود، به یک خط مشی بهینه در تصمیم سازی به منظور یادگیری وظیفه، دست یابد. نتایج آزمایش ها کارایی این چارچوب را نشان می دهند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

پیش بینی رفتار رانندگی بر اساس کنترل اجتماعی و هیجان خواهی در رانندگان وسایل نقلیه عمومی برون شهری

انسان همواره در تمامی حالات زندگی رفتارهایی را اتخاذ مینماید، که میتواند نتایج بسیار متفاوتی داشته باشد، بنابراین هدف این پژوهش بررسی پیش بینی رفتار رانندگی بر اساس کنترل اجتماعی و هیجان خواهی در رانندگان وسایل نقلیه عمومی برون شهری ساری بود. روش پژوهش توصیفی از نوع همبستگی میباشد. جامعه پژوهش شامل تمامی رانندگان وسایل نقلیه برون شهری شهر ساری در سال 1397 بود و با روش نمونه گیری هدفمند تعداد نم...

متن کامل

پیش بینی میزان استفاده از شبکه‌های مجازی بر اساس سازگاری اجتماعی و کنترل عواطف در نوجوانان

چکیدهمقدمه: اینترنت دنیای مجازی است که به افراد فرصت تجربه شکل خاصی از روابط اجتماعی را میدهد که در آن افراد حضور اجتماعی واقعی ندارند. بنابراین با توجه به اهمیت آسیب‌شناسی فضای مجازی در توسعه جوامع، در جامعه ما نیز در سال‌های اخیر به فن‌آوری اطلاعات و ارتباطات توجه زیادی شده است. تحقیق پیش رو با هدف پیش‌بینی میزان استفاده از شبکه‌های مجازی بر اساس سازگاری اجتماعی و کنترل عواطف در نوجوانان انجا...

متن کامل

پیش بینی طلاق عاطفی بر اساس سبک‫های کنترل تعارض و سرسختی روانشناختی در زوجین

هدف: هدف از انجام پژوهش حاضر پیش بینی طلاق عاطفی بر اساس سبک‫های کنترل تعارض و سرسختی روانشناختی در زوجین بود، روش: این پژوهش از نظر هدف کاربردی و از نظر شیوه گردآوری داده ها توصیفی و از نوع همبستگی بود.جامعه آماری این پژوهش شامل کلیه زوجین شهر کرمانشاه در سال 1396 بود که به مراکز مشاوره مراجعه کرده‫ بودند،  نمونه آماری این پژوهش تعداد 200 نفر از زوجین (100 زو...

متن کامل

پیش بینی کننده های رانندگی غیر ایمن در شهر یزد بر اساس تئوری انگیزش محافظت در سال 1389

زمینه و هدف: حوادث جاده ای یکی از مهمترین موضوعات سلامت عمومی جهان در قرن 21 است. یکی از مهمترین عوامل بروز تصادفات رانندگی عامل انسانی است. هدف مطالعه حاضر تعیین پیش بینی کننده های رانندگی غیر ایمن در شهریزد بر اساس تئوری انگیزش محافظت می‌باشد. روش تحقیق: در این پژوهش مقطعی، 379 نفر از افراد 19 ساله و بالاتر، به روش خوشه ای تصادفی از جمعیت تحت پوشش مراکز بهداشتی درمانی شهری شهر یزد مورد مطالع...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده برق

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023