الگوریتم یادگیری تقویتی فازی

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

ژورنال: کنترل 2012

درهمی, ولی, فتحی نژاد, فاطمه,

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

Performance Evaluation with a Combination of Balanced Scorecard Model and the Fuzzy Best-Worst Method (Case Study: Mashhad City Train Operation Company)

Journal: : 2022

هدف اصلی این پژوهش ارائه چارچوبی برای ارزیابی عملکرد شرکت بهره‌برداری قطار شهری مشهد بر مبنای کارت امتیازی متوازن و تکنیک تصمیم‌گیری چندمعیاره (بهترین ـ بدترین فازی) است. حاضر از نظر هدف، کاربردی روش، کمّی اسنادی جمع‌آوری داده‌های کیفی اساس 15 خبره در طی مقطع زمانی بین سال‌های 1396 تا 1398 صورت پذیرفت. 9 معیار منظر مالی، 16 مشتریان، 8 فرایند داخلی 14 رشد توسعه یادگیری طریق اسناد پژوهش‌های پ...

متن کامل

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

ژورنال: :کنترل 0

فاطمه فتحی نژاد fateme fathinezhad دانشگاه یزد ولی درهمی vali derhami دانشگاه یزد

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...

متن کامل

آشکارسازی صورت مبتنی بر ویژگیهای هارمانند بهبود یافته

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده فنی 1393

فریبا تقی نژاد, فردین اخلاقیان طاب,

در این پایان نامه آشکارسازی صورت به کمک فیلترهای هارمانند بهبود یافته بررسی شده است. یکی از مشکلات سیستم های آشکارسازی صورت مبتنی بر ویژگی های هارمانند، استفاده از دو مقدار 1+ و 1- برای بخش های مستطیلی شکل ویژگی ها و تأکید بر مستطیلی بودن ویژگی هاست که انعطاف پذیری و کارایی این ویژگی ها را کاهش می دهد. در این پایان نامه سه روش جدید برای طراحی ویژگی های هارمانند ارائه شده است. در اولین روش، که م...

15 صفحه اول

ترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر 1391

فاطمه فتحی نژاد, ولی درهمی, مهدی رضاییان,

استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...

15 صفحه اول

ارائه الگوریتم جدید fuzzy sarsa بهمنظور پیش بینی نوسانات سطح قند خون بیماران مبتلا به دیابت نوع یک

ژورنال: :مجله دیابت و متابولیسم ایران 0

حسین فرضعلی وند hossein farzalivand khozestan, izeh, zagros street, izeh branch, islamic azad university, young researchers club phone: 09384221895خوزستان، ایذه، خیابان زاگرس، میدان دانشجو، دانشگاه آزاد اسلامی واحد ایذه، باشگاه پژوهشگران و نخبگان تلفن: 09384221895

مقدمه: یکی از عوارض خطرناک بیماری دیابت نوع یک افزایش و کاهش ناگهانی سطح غلظت قند خون می باشد که باعث بروز خطراتی چون اغماء و بیهوشی خواهد شد. بنابراین استفاده از روش هایی با درصد خطای پایین و هوشمند با اطلاعات موجود در جهت پیش بینی و در نهایت پیشگیری از این عوارض،گام مهمی در جهت کنترل بهینه بیماری محسوب می شود. به همین منظور در این مقاله ما از الگوریتم ترکیبی fuzzy sarsa برای طراحی سیستم خبره ...

متن کامل

یک روش ترکیبی جدید یادگیری تقویتی فازی

ژورنال: کنترل 2014

درهمی, ولی, قربانی, فرزانه , نظام آبادی پور, حسین,

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و ...

متن کامل

روش یادگیری q-فازی در ترکیب با روش های بهینه سازی برای کنترل فازی تقویتی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه شهید باهنر کرمان - دانشکده مهندسی 1393

سیما سعید, علی اکبر نیک نفس, مهدی افتخاری,

طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...

15 صفحه اول

ارائه یک روش جدید یادگیری تقویتی پیوسته با تاکید بر تحلیل ریاضی

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر 1392

فرزانه قربانی, ولی درهمی, حسین نظام آبادی پور,

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

15 صفحه اول

الگوریتم های یادگیری تقویتی فازی در محیط های نویزی با استفاده از سیستم های فازی بازه ای

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی 1391

نوشین نصری مهاجری, محمد باقر نقیبی سیستانی,

یادگیری تقویتی همچونبرنامه ریزی پویادر حل مسائل با فضای حالت پیوسته با چالش نفرین ابعادروبروست. تعمیم ارزش یک حالت به سایر حالت های مجاوربا استفاده از تقریبگرهای عمومی یکی از راهکارهایی است که برای حل این مسئله پیشنهادشده است. در این روش عامل مجموعه ای محدود از فضای حالت را تجربه می کند و از طریق تعمیم دهی تقریب خوبی از کل فضا را بدست می آورد. یکی از بهترین تقریبگرهای عمومیسیستم های فازی اند. د...

15 صفحه اول