یک روش ترکیبی جدید یادگیری تقویتی فازی

نویسندگان

چکیده مقاله:

در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه می‌شود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته می‌شود. هدف، یافتن مناسب‌ترین عمل نامزد (تالی) برای هر قاعده می‌باشد. با استفاده از بردار شدت آتش قواعد فازی و عمل‌های نامزد مربوط به قواعد، توابع پایه حالت –عمل به گونه‌ای تعریف شده‌اند که شرایط قضایای روش تکرار سیاست کمترین مربعات را برآورده می‌نمایند. با استفاده از توابع پایه حالت- عمل تعریف شده و بهره‌گیری از الگوریتم تکرار سیاست کمترین مربعات، یک روش جدید برای تازه‌سازی پارامترهای وزن تالی قواعد ارائه می‌شود. تحلیل ریاضی که برای این الگوریتم آورده می‌شود، کران خطایی برای اختلاف تابع مقدار ارزش حالت-عمل واقعی و تخمین تابع ارزش حالت-عمل حاصل از الگوریتم ارائه شده، تعریف می‌کند. نتایج شبیه‌سازی در مساله معروف قایق، حاکی از سرعت آموزش بالاتر و نیز کیفیت عملکرد بهترِ روش پیشنهادی نسبت به دو روش یادگیری کیوی فازی و یادگیری سارسای فازی است. از مزایای دیگر روش ارائه شده، عدم نیاز به تعیین نرخ آموزش است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تولید قواعد فازی احتمالی به‌کمک یادگیری تقویتی

مهم‌ترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با داده‌های آموزشی، وجود داده‌های ناسازگار است زیرا در این‌گونه داده‌ها چند خروجی برای وضعیت‌های یکسان وجود دارد. لذا تولید قواعد و تصمیم‌گیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روش‌های موجود از برآیند حالت‌های ناسازگار استفاده می‌کنند که باعث تولید خروجی با مقدار میانگین تالی‌ه...

متن کامل

یک روش جدید برای انتخاب ویژگی مبتنی بر منطق فازی

چکیده: انتخاب ویژگی یکی از چالش برانگیز ترین و از مهمترین فعالیت‌ها در توسعه یادگیری ماشین و تشخیص الگوست. معیارهای ارزیابی ویژگی نقش بسیار مهمی برای ساخت یک الگوریتم انتخاب ویژگی دارند. در این مقاله یک معیار انتخاب ویژگی اصلاح شده با استفاده از منطق فازی برای انتخاب تعداد ویژگی‌های مورد نیاز ارائه می شود. این معیار به شکل غیر فازی در تحقیقات قبلی استفاده می‌شود، اما در این مقاله با تعریف تعداد...

متن کامل

یک روش چند عاملی جدید مبتنی بر یادگیری تقویتی برای شکل دهی ترافیک و تخصیص حافظه بافر در روترها

چکیده دراین مقاله با توجه به ساختار توزیع شده شبکه های کامپیوتری و رفتار تصادفی موجود در آنها و از طرف دیگر محدودیت های زمانی که در الگوریتم های کنترلی برای اینگونه سیستمها وجود دارد، از مفاهیم سیستم های چند عاملی و تکنیک های یادگیری تقویتی برای شکل دهی ترافیک در روترها و تخصیص دینامیک حافظه بافر بین پورت های مختلف یک روتر استفاده شده است. در واقع با استفاده از این مفاهیم شکل دهنده ترافیک جدیدی...

متن کامل

روش یادگیری q-فازی در ترکیب با روش های بهینه سازی برای کنترل فازی تقویتی

طراحی کنترل کننده های فازی با استفاده از الگوریتم های تکاملی و یادگیری تقویتی q - فازی موضوعی است که در کنترل ربات ها نقش مهمی ایفا می کند. در این پایان نامه سه روش پیشنهادی برای حل مسائل کنترلی فازی تقویتی ارائه گردیده است و هر سه این روش ها روی یک مسئله فازی تقویتی به نام، ماشین عقب رونده به سمت بالا، شبیه سازی شده اند و همه ی این روش ها از ترکیب یادگیری q-فازی با یک الگوریتم بهینه سازی ایجاد...

15 صفحه اول

ارائه یک روش جدید یادگیری تقویتی پیوسته با تاکید بر تحلیل ریاضی

یکی از چالش های یادگیری تقویتی، عدم وجود الگوریتم های قابل اجرا در فضای حالت و عمل پیوسته است که دارای استدلال ریاضی باشند. در این پایان نامه سعی داریم با ارائه یک روش جدید یادگیری تقویتی پیوسته مبتنی بر معماری نقاد-تنها برای مسائل کنترل این چالش ها را برطرف کنیم. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات" با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی"...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 8  شماره 1

صفحات  11- 20

تاریخ انتشار 2014-06

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023